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NOUVELLE PROTEINE ASSOCIEE AUX CENTROSOMES ET SES 

APPLICATIONS. 

La presente Invention est relative a une nouvelle proteine 
associee aux centrosomes, au polynucleotide codant pour ladite proteine ainsi 
5 qu'aux applications de ladite proteine et dudit polynucleotide. 

Le processus de division cellulaire consiste en une division 
nucleaire (mitose) suivie d'une division cytoplasmique (cytokinese). La mitose 
est dominee par la formation d'un fuseau polaire tres organise (le fuseau 
mitotique) constitue de deux families de microtubules : les microtubules 

10 polaires et les microtubules kinetochoriens. Les microtubules sont des poly- 
meres composes de sous-unites d'ct- et p-tubuline. Leur croissance est initiee 
dans la region peripherique du centrosome par un complexe contenant majo- 
ritairement une proteine apparentee, la y-tubuline. Les microtubules polaires 
sont composes de rangees de microtubules et de proteines associees qui 

15 sont mises en place par les deux centres mitotiques, associes a des 
centrioles, situes aux poles opposes du fuseau (asters). Chaque chromosome 
replique est constitue de deux chromatides soeurs reliees entre elles par le 
centromere. Les microtubules kinetochoriens sont lies aux chromosomes 
repliques par des structures specialisees appelees kinetochores qui se 

20 forment au cours de la prophase sur chacune des deux faces du centromere. 
Les chromosomes se condensent pendant la prophase et forment les micro- 
tubules kinetochoriens qui commencent a interagir avec les microtubules 
polaires du fuseau apres rupture de Penveloppe nucleaire au cours de la 
prometaphase. Sous I'effet de la tension due aux forces opposees, dirigees 

25 vers les poles qui tirent les microtubules kinetochoriens, les chromosomes 
s'alignent dans la zone equatoriale du fuseau pendant la metaphase. A Tana- 
phase, sous Teffet de forces continuellement developpees au sein du fuseau 
mitotique, les chromatides sceurs se detachent et sont attirees vers les poles 
opposes. Dans le meme temps, les deux poles cellulaires s'ecartent. Au cours 

30 de la telophase, Tenveloppe nucleaire se reforme a la surface de chaque 
groupe de chromosomes. 
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La division cellulaire s'acheve au moment ou le contenu cyto- 
plasmique est divise selon le processus de cytokinese. Le fuseau mitotique 
joue un role important dans le processus de cytokinese, en fixant la mise en 
place de la segmentation cellulaire. Le sillon de division apparait invariable- 
5 ment dans le plan de la plaque equatoriale, perpendiculairement a I'axe du 
fuseau mitotique. 

Les processus decrits ci-dessus sont finement regules par un 
equilibre entre des reactions de phosphorylation et de dephosphorylation. 
Lorsque la cellule entre en mitose, des changements importants dans la 

10 phosphorylation des proteines interviennent Le centrosome et le fuseau 
mitotique sont particulierement enrichis en sites phosphoryles. De 
nombreuses proteine-kinases, particulierement des serine-threonine-kinases, 
ont ete decrites comme intervenant dans ces processus de phosphorylation 
(voir a cet egard Giet R. et Prigent C, J. Cell Science, 112, 3591-3601, 1999). 

15 Parmi celles-ci on citera celles localisees au niveau des centrosomes, parmi 
lesquelles les kinases de type aurora, requises pour la separation des centro- 
somes et 1'assernblage du fuseau mitotique, les kinases de type polo, impli- 
quees dans la maturation et la formation du fuseau bipolaire et les kinases de 
type NIMA qui regulent la separation des centrosomes. 

20 Les mammiferes possedent au moins trois proteine-kinases 

du type aurora. Chez Phomme, ces trois proteine-kinases sont surexprimees 
dans des pathologies cancereuses du fait d'anomalies chromosomiques. 
Ainsi, ces proteines semblent jouer un role important dans le controle de la 
ploYdie, Par exemple, une inactivation ou une surexpression de deux de ces 

25 kinases conduit a une polyploTdie. ^inhibition de Tactivite de la kinase aurora 
A conduit a la formation de fuseaux monopolaires. Uinhibition de Tactivite de 
ia kinase aurora B conduit a la formation de cellules multinucleees par defaut 
de cytokinese. Ces anomalies chromosomiques apparaissent liees a des 
perturbations dans la formation du fuseau mitotique. 

30 Les partenaires et les substrats de ces proteine-kinases sont 

encore peu connus. Par exemple, chez le xenope, aurora A interagit avec une 
kinesine impliquee dans la dynamique des microtubules. Chez I'homme, elle 
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phosphoryle la proteine HsTACC-3, egalement surexprimee dans de 
nombreuses lignees de cellules cancereuses. Chez la drosophile, aurora A 
phosphoryle la proteine D-TACC et est necessaire a sa localisation aux 
centrosomes afin de reguler les microtubules astraux. D-TACC interagit avec 
la proteine associee aux microtubules (MAP : Microtubule Associated Protein) 
Msp, qui fait partie de la famille des proteines XMA0215/ch-TOC/Msps, qui 
stimulent la croissance des microtubules in vitro et sont concentrees au 
niveau des centrosomes in vivo. D-TACC et Msp cooperent pour stabiliser les 
centrosomes. Le terme MAP regroupe une collection de proteines variees 
definies sur la base de leur capacite a interagir avec les microtubules. Les 
MAP apparaissent comme des partenaires/substrats des kinases du centro- 
some comme aurora ou polo. 

Une division cellulaire correcte necessite une coordination 
entre la segregation des chromosomes par le fuseau mitotique et le clivage de 
la cellule par I'appareil de cytokinese. Les microtubules du fuseau mitotique 
jouent un role essentiel dans les deux processus. 

Cependant, malgre I'ensemble des travaux realises sur la 
division cellulaire, les facteurs intervenant dans une mise en place correcte du 
fuseau mitotique et/ou au contraire perturbant sa mise en place et/ou sa 
structure, entramant ainsi les consequences ci-dessus decrites ne sont 
toujours pas connus. 

Une telle connaissance permettrait d'une part de mieux 
comprendre les mecanismes de la mitose et d'autre part de pouvoir develop- 
per des moyens de lutter contre les anomalies de la division cellulaire et les 
consequences qu'elles entrament. 

C'est dans ce domaine que se place la presente Invention. 

En effet, de maniere surprenante et inattendue, les Inventeurs 
ont mis en evidence une nouvelle proteine hiimaine associee aux centro- 
somes. Par immunofluorescence, elle est detectee en colocalisation avec Tot- 
tubuline des microtubules du fuseau mitotique, en particulier avec Taster. 
Cette proteine a ete nommee ASAP pour Aster Associated Protein (Proteine 
Associee a PAster) par les Inventeurs. 
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La surexpression de la proteine selon Nnvention entraTne des 
perturbations dans 1'organisation du fuseau mitotique et induit des mitoses 
aberrantes et abortives (cellules plurinucleees, fuseaux mono- ou multi- 
polaires). Sa surexpression bloque la division cellulaire et par consequent la 
5 proliferation cellulaire. 

Ainsi, Tlnvention a pour objet une proteine isotee, denommee 
ASAP, caracterisee en ce qu'elle est selectionnee dans le groupe constitue 
par : 

a) une proteine repondant a la sequence representee dans la 
10 liste de sequences en annexe sous le numero SEQ ID NO: 1 ; 

b) une proteine presentant, sur la totalite de sa sequence, au 
moins 80% d'identite ou au moins 90% de similarity, de preference au moins 
90 % d'identite ou au moins 95% de similarity, avec la proteine de SEQ ID 
NO: 1. 

15 Une proteine conforme a Tlnvention se caracterise par les 

proprietes suivantes : 

elle presente un poids moleculaire compris entre 60 et 
100 kDa, de preference entre 65 et 80 kDa ; 

elle est associee aux centrosomes ; 
20 - elle est colocalisee par immunofluorescence avec 

I'cc-tubuline des microtubules du fuseau mitotique ; 

elle presente une faible identite (23%) avec la proteine 
MAPI A (Microtubule Associated Protein 1A) ; 

elle presente des domaines coiled-coil essentiellement 
25 regroupes dans sa partie C-terminale entre les acides amines 297 et 327 
d'une part et 477 et 628 d'autre part, indiquant soit que la proteine s'oligo- 
merise, soit qu'elle interagit avec d'autres proteines ; 

elle presente une faible identite (20%), entre les acides 
amines 300 et 600 avec un domaine de type caldesmon (Gusev, N.B M 
30 Biochemistry, 10 : 1112-1121, 2000), reference pfam00769 (NCBI, domains, 
http://www.n^^ et, 
entre les acides amines 480 et 630, avec un domaine de type ERM 
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(Ezrin/radixin/moesin ; Louvet-Vallet, S., Biol. Cell, 274 : 305-316, 2000), refe- 
rence pfam02029 (NCBI, domains, http://www.ncbi.nlm.nih.gov/Structure/ 
cdd/cddsrv.cgi?uid=pfam02029). Les proteines caldesmon et ERM sont egale- 
ment considerees comme des MAP ; 

elle presente egalement, entre les positions 65 et 303, un 
domaine BRCT, (Breast cancer carboxy-terminal domain ; Bork, P., et coll., 
FASEB J., 11, 68-76 (1997)), indiquant que la proteine est impliquee dans le 
controle du cycle cellulaire' ; 

elle presente une grande richesse en helices a dans sa 
partie C-terminale, en particulier dans la region comprise entre les acides 
amines 420-620, presque exclusivement formee d'helices a. 

Ces elements permettent de penser que la proteine ASAP est 
une nouvelle MAP. 

Les proteines selon I'lnvention incluent toute proteine (natu- 
relle, synthetique, semi-synthetique ou recombinante) de n'importe quel orga- 
nisme procaryote ou eucaryote, notamment d'un mammifere, comprenant ou 
consistant en une proteine ASAP. Preferentiellement, ladite proteine est une 
proteine ASAP fonctionnelle. 

On entend par "fonctionnelle", une proteine possedant une 
activite biologique normale, c'est a dire capable d'intervenir dans 
I'organisation du fuseau mitotique et dans la division cellulaire. Cette proteine 
peut comprendre des mutations silencieuses n'induisant aucun changement 
substantiel dans son activite et ne produisant aucune modification pheno- 
typique. 

Des proteines conformes a I'invention sont notamment repre- 
sentees par les proteines ASAP humaine (SEQ ID NO : 1) et murine (SEQ ID 
NO : 46). 

Sont incluses dans les proteines selon I'lnvention definies en 
b), les proteines variantes des sequences SEQ ID NO: 1 et 46, en particulier 
les proteines dont la sequence en acides amines presente au moins une 
mutation correspondant notamment a une troncation, une deletion, une 
substitution et/ou une addition d'au moins un residu d'acide amine par rapport 
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aux sequences SEQ ID NO: 1 et 46. 

De maniere preferee, les proteines variantes presentent une 
mutation entraTnant un dysfonctionnement (activation ou inhibition) de la 
proteine, d'autres genes ou proteines ou encore de la cellule en general. 
5 Selon un autre mode de realisation avantageux de I'lnvention, 

ladite proteine est une proteine de mammifere, preferentiellement une 
proteine d'origine humaine. 

Au sens de la presente Invention les definitions suivantes 

s'appliquent. 

10 L'identite d'une sequence par rapport a la sequence de SEQ 

ID NO :1 comme sequence de reference s'apprecie en fonction du pourcen- 
tage de residus d'acides amines qui sont identiques, lorsque les deux 
sequences sont alignees, de maniere a obtenir le maximum de corres- 
pondance entre elles. 

15 Le pourcentage d'identite peut etre calcule par PHomme du 

metier en utilisant un programme informatique de comparaison de sequences 
tel que, par exemple celui de la suite BLAST (Altschul et al., NAR, 1997, 25, 
3389-3402). 

Les programmes BLAST sont mis en oeuvre sur la fenetre de 
20 comparaison constitute par la totalite de la SEQ ID NO :1, indiquee comme 
sequence de reference. 

Une proteine ayant une sequence en acides amines ayant au 
moins X % dldentite avec une sequence de reference est definie, dans la 
presente Invention comme une proteine dont la sequence peut inclure jusqu'a 
25 100-X alterations pour 100 acides amines de la sequence de reference, tout 
en conservant les proprietes fonctionnelles de ladite proteine de reference. Au 
sens de la presente Invention, !e terme alteration inclut les deletions, les 
substitutions ou les insertions consecutives ou dispersees decides amines 
dans la sequence de reference. 
30 La similarite d'une sequence par rapport a une sequence de 

reference s'apprecie en fonction du pourcentage de residus d'acides amines 
qui sont identiques ou qui different par des substitutions conservatives, 
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lorsque les deux sequences sont alignees de maniere a obtenir le maximum 
de correspondance entre elles. Au sens de la presente Invention, on entend 
par substitution conservative, la substitution d'un acide amine par un autre qui 
presente des proprietes chimiques ou physiques similaires (taille, charge ou 
polarite), qui generalement ne modifie pas les proprietes fonctionnelles de la 
proteine. 

Une proteine ayant une sequence en acides amines ayant au 
moins X % de similarity avec une sequence de reference est definie, dans la 
presente Invention comme une proteine dont la sequence peut inclure jusqu'a 
100-X alterations non-conservatives pour 100 acides amines de la sequence 
de reference. Au sens de la presente Invention, le terme alterations non- 
conservatives inclut les deletions, les substitutions non-conservatives ou les 
insertions consecutives ou dispersees decides amines dans la sequence de 
reference. 

Par "techniques ou methodes bien connues de Thomme du 
metier" on entend ici se referer aux techniques ou methodes classiquement 
utilisees par I'homme du metier et exposees dans de nombreux ouvrages, 
comme en particulier celui intitule Molecular Cloning. A Laboratory Manual 
(Sambrook J, Russell DW. (2000) Cold Spring Harbor Laboratory Press). 

La proteine selon I'lnvention est obtenue soit a partir d'une 
cellule, soit par synthese chimique, soit par recombtnaison genetique. 

Par synthese chimique, la proteine peut etre obtenue en utili- 
sant Tune des nombreuses voies de syntheses peptidiques connues, par 
exemple les techniques mettant en oeuvre des phases solides ou des 
techniques utilisant des phases solides partielles, par condensation de frag- 
ments ou par une synthese en solution classique. Dans ce cas, la sequence 
de la proteine peut etre modifiee afin d'ameliorer sa solubilite, en particulier 
dans les solvants aqueux. De telles modifications sont connues de I'homme 
du metier comme par exemple la deletion de domaines hydrophobes ou la 
substitution d'acides amines hydrophobes par des acides amines hydrophiles. 

La proteine selon I'lnvention est constitute de TenchaTnement 
de 13 peptides correspondants aux produits de traduction de 13 des 14 exons 
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que comporte le gene correspondant, le premier exon n'etant pas traduit (voir 
ci-apres). 

De maniere plus precise, lesdits peptides repondent aux 
sequences suivantes (positions donnees par rapport a la numerotation de la 
5 sequence SEQ ID NO: 1) : 

- Peptide 1 : il comprend 25 acides amines correspondants 
aux positions 1 a 25 (SEQ ID NO: 2) ; 

- Peptide 2 : il comprend 28 acides amines correspondants 
aux positions 26 a 53 (SEQ ID NO: 3) ; 

10 - Peptide 3 : il comprend 107 acides amines correspondants 

aux positions 54 a 160 (SEQ ID NO: 4) ; 

- Peptide 4 : il comprend 76 acides amines correspondants 
aux positions 161 a 236 (SEQ ID NO: 5) ; 

- Peptide 5 : il comprend 31 acides amines correspondants 
15 aux positions 237 a 267 (SEQ ID NO: 6) ; 

- Peptide 6 : il comprend 83 acides amines correspondants 
aux positions 268 a 350 (SEQ ID NO: 7) ; 

- Peptide 7 : il comprend 24 acides amines correspondants 
aux positions 351 a 374 (SEQ ID NO: 8) ; 

20 - Peptide 8 : il comprend 54 acides amines correspondants 

aux positions 375 a 428 (SEQ ID NO: 9) ; 

- Peptide 9 : il comprend 32 acides amines correspondants 
aux positions 429 a 460 (SEQ ID NO: 10) ; 

- Peptide 10 : il comprend 54 acides amines correspondants 
25 aux positions 461 a 514 (SEQ ID NO: 11); 

- Peptide 1 1 : il comprend 49 acides amines correspondants 
aux positions 515 a 563 (SEQ ID NO: 12) ; 

- Peptide 12 : il comprend 43 acides amines correspondants 
aux positions 564 a 606 (SEQ ID NO: 13) ; 

30 - Peptide 13 : il comprend 41 acides amines correspondants 

aux positions 607a 647 (SEQ ID NO: 14). 
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La presente Invention a aussi pour objet un peptide constitue 
d'un fragment d'au moins 10 acides amines consecutifs d'une proteine definie 
ci-dessus en a) ou b), particulierement un peptide selectionne parmi : 

- les sequences correspondant aux peptides 1 a 13 decrits ci- 
5 dessus, c'est-a-dire selectionne parmi les sequences SEQ ID NO: 2 a SEQ ID 
NO: 14, et 

- les sequences SEQ ID NO : 47 a 53 correspondant a des 
mutants de la proteine hASAP deletes de la partie N-terminale contenant le 
domaine BRCT (Ndell : residus 304 -647 (SEQ ID NO: 48) ; Ndel2 : residus 
10 41 1-647 (SEQ ID NO : 49) ; Ndel3 : residus 478-647 (SEQ ID NO : 50)) ou de 
la partie C-terminale contenant le domaine MAP (CdeM : residus 1 a 477 
(SEQ ID NO: 51) ; Cdel2 : residus 1 a 418 (SEQ ID NO: 52) ; Cdel3 : residus 
1 a 303 (SEQ ID NO: 53) ; residus 1 a 421 (SEQ ID NO: 47)). 

Selon un mode de realisation avantageux de I'lnvention, ledit 
15 peptide est utile pour la production d'anticorps reconnaissant specifiquement 
une proteine telle que definie ci-dessus, preferentiellement reconnaissant la 
proteine ASAP de sequence SEQ ID NO: 1 ou SEQ ID NO: 46. 

L'lnvention a ainsi egalement pour objet des anticorps mono- 
clonaux ou polyclonaux, caracterises en ce qu'ils sont capables de 
20 reconnaTtre specifiquement une proteine selon l'lnvention. 

De maniere preferentielle selon l'lnvention, les anticorps 
reconnaissent, parmi les MAPs, uniquement et specifiquement la proteine 
ASAP de sequence SEQ ID NO: 1 ou SEQ ID NO: 46. 

Les anticorps selon l'lnvention sont, par exemple, des anti- 
25 corps chimeriques, des anticorps humanises, des fragments Fab ou F(ab')2. 
lis peuvent egalement se presenter sous forme d'immunoconjugues ou d'anti- 
corps marques afin d'obtenir un signal delectable et/ou quantifiable. 

Lesdits anticorps peuvent etre obtenus directement a partir de 
serum humain ou a partir de serum d'animaux immunises avec les proteines 
30 ou les peptides selon l'lnvention. Les anticorps polyclonaux ou monoclonaux 
specifiques peuvent etre obtenus selon les techniques bien connues de 
I'Homme du Metier. 
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LMnvention a egalement pour objet Tutilisation des anticorps 
selon Tlnvention pour la detection et/ou la purification d'une proteine selon 
I'lnvention. 

De maniere generate, les anticorps selon Tlnvention peuvent 
5 etre avantageusement utilises pour detecter la presence d'une proteine selon 
Tlnvention, normale ou mutee. 

Particulierement, les anticorps monoclonaux, peuvent etre uti- 
lises pour la detection de ces proteines dans un echantillon biologique. lis 
constituent ainsi un moyen d'analyse irnmunocytochirnique ou immuno- 

10 histochimique de Texpression des proteines selon I'lnvention, notamment la 
proteine de sequence SEQ ID NO: 1, surdes coupes de tissus. Generalement 
pour de telles analyses, les anticorps utilises sont marques afin d'etre detec- 
tables par exemple par des composes immunofluorescents, par marquage a 
Tor ou sous forme d'immunoconjugues enzymatiques. 

15 lis peuvent permettre notamment de mettre en evidence une 

expression anormale de ces proteines dans les tissus ou prelevements 
biologiques et ainsi permettre la detection de cellules presentant des pertur- 
bations dans Torganisation du fuseau mitotique et/ou une induction des 
mitoses aberrantes et abortives (cellules plurinucI6ees, fuseaux mono- ou 

20 multipolaires) liees a la surexpression de la proteine selon I'lnvention. 

L'lnvention a egalement pour objet une methode de detection 
dans un echantillon biologique de la proteine selon Tlnvention, particuliere- 
ment de la proteine ASAP, comprenant une premiere etape de traitement 
convenable des cellules par tout moyen approprie permettant de rendre 

25 accessible le milieu intracellular, une seconde etape de mise en contact 
dudit milieu intracellular ainsi obtenu avec un anticorps selon Tlnvention et 
une troisieme etape de mise en evidence par tout moyen approprie du 
complexe proteine ASAP-anticorps forme. 

Cette methode peut en outre permettre de mesurer le taux 

30 d'expression de la proteine selon Tlnvention dans des cellules, particuliere- 
ment dans des cellules canc^reuses. L'etude de Texpression de la proteine 
ASAP (sur- ou sous-expression) est un element devaluation de la capacite de 
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proliferation ou cTagressivite (capacite a evoluer vers des cancers de mauvais 
pronostic) de cellules cancereuses. 

Ulnvention a done egalement pour objet une methode deva- 
luation in vitro de la capacite de proliferation ou d'agressivite des cellules 
5 cancereuses contenues dans un echantillon biologique, caracterisee en ce 
qu'elle comprend une premiere etape de traitement convenable des cellules 
par tout moyen approprie permettant de rendre accessible le milieu intra- 
cellulaire, une seconde etape de mise en contact dudit milieu intracellulaire 
ainsi obtenu avec un anticorps selon I'lnvention, une troisieme etape de mise 

10 en evidence et/ou de mesure par tout moyen approprie du complexe proteine 
ASAP-anticorps forme et une quatrieme etape devaluation du taux de 
transcription du gene par comparaison du taux de complexes proteine 
ASAP-anticorps formes a celui d'un echantillon biologique temoin prealable- 
ment choisi. Ledit temoin peut etre constitue par exemple par un echantillon 

15 biologique contenant des cellules presentant un taux de proteines normal ou 
altere, auquel ladite methode est appliquee dans les memes conditions. 

Ulnvention a egalement pour objet une trousse permettant de 
mettre en oeuvre Tune quelconque des methodes ci-dessus decrites compre- 
nant : 

20 a) au moins un anticorps monoclonal ou polyclonal selon 

T Invention ; 

b) les reactifs permettant la detection du complexe proteine 
ASAP-anticorps produit lors de la reaction immunologique. 

Selon un mode de realisation particulier de Tlnvention, la 
25 trousse peut eventuellement comprendre des reactifs necessaires pour rendre 
accessible le milieu intracellulaire. 

Par moyen pour rendre accessible le milieu intracellulaire, on 
entend tout moyen connu de THomme du Metier comme par exemple la lyse 
cellulaire par voie enzymatique, chimique ou encore la sonication, la permea- 
30 tion membranaire, les chocs thermiques. 
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La presente Invention a egalement pour objet un poly- 
nucleotide isole (ADNc ou fragment d'ADN genomique), caracterise en ce que 
sa sequence est selectionnee dans le groupe constitue par : 

les sequences codant pour une proteine ou un peptide 
5 tels que definis ci-dessus, et 

les sequences complementaires des precedentes, sens 

ou anti-sens. 

L'lnvention englobe, les alleles du gene asap issus de 
n'importe quel mammifere, ainsi que les polynucleotides des mutants naturels 

10 ou artificiels du gene asap codant pour une proteine ASAP, particulierement 
pour une proteine ASAP fonctionnelle telle que definie ci-dessus. 

Selon un mode de realisation avantageux de l'lnvention, ledit 
polynucleotide codant pour une proteine ASAP repond a une sequence selec- 
tionnee dans le groupe constitue par : 

15 - la sequence SEQ ID NO: 15, correspondant a TADN 

complementaire de 2575 nucleotides de PARNm codant pour la proteine 
ASAP humaine (hASAP) ; 

la sequence SEQ ID NO: 45, correspondant a I'ADN 
complementaire de 2767 nucleotides de I'ARNm codant pour la proteine 

20 ASAP murine (mASAP) 

le fragment d'ADN genomique de 29750 nucleotides 
repondant a la sequence representee dans la liste des sequences en annexe 
sous le numero SEQ ID NO: 16, correspondant au g6ne asap humain 
comprenant 14 exons dont 13 seulement sont traduits, le premier exon n'§tant 

25 pas traduit, contenue dans le contig AC097467 (longueur 178204 paires de 
bases) entre les bases 115117 et 143828 (version v.7.29a3 NCBI/Ensembl du 
12 juillet 2002, http://www.ensembl.org), par ailleurs localisee sur le 
chromosome 4q32.1 entre les marqueurs anonymes D4S1053 et D4S571 
(region 161,25 Megabases (Mb) a 161,28 Mb). 

30 La sequence SEQ ID NO: 16 est contenue dans le clone BAC 

RP1 1-27G13 (Osoegawa, K., et col., (2001) A Bacterial Artificial Chromosome 
Library for Sequencing the Complete Human Genome, Genome Research, 
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Vol. 11, n°3, 483-496, mars 2001). Les sequences contenues dans le contig 
AC097467 et dans le clone BAC RP1 1-27G13 ont ete obtenues dans le cadre 
du programme de sequencage du genome humain et n'ont jusqu'a present fait 
I'objet d'aucune reconnaissance ni caracterisation precises permettant de leur 
attribuer une quelconque fonction. Deux acides nucleiques correspondants a 
des fragments du polynucleotide isole par les Inventeurs sont repertories dans 
la base de donnees GenBank sous les numeros d'acces AK024730 et 
AK024812, ainsi que les EST repertories sous les numeros d'acces 
BU1 98882, BM693711, AW372449, BM021380, BU928828, AL707573, 
AI885274, AI671785, AA805679, BU619959, BM021126, AL598336, 
AW976973, BU629726, AI433877, AV751613, BQ372751, AI827535, 
AI866257, AA843565, R96130, BU684090, BF958121, BQ351941, 
AW1 94906, BG203580, BF078132, AW486134, AL600279, AA025538, 
AL600264, BF170676, BU759494, BB025236, BF214179, AI283076, 
BE694273, AI266380, BM670854, AA968415, BU503982, BB700612, 
BE988355, BU058357, BB312934, AW061311, BM537962, BE988356, 
BB318982, BB311217, BB557152, BB185248, BB557128, BB698742, 
BB1 86736, AV345769, BB274293, BB632007, BB617958, AI391312, 
W18534, BB186581, BB311289, BB312835, AW347411, AA972439, 
BB263570, AU035125, BB277226, BB274224, BB268445, AW024037, 
AA025609, BB274174, R96089, BB272238, BB269037, BB385718, 
BE007324, BB325992, AJ275277, AI414381, BB125476, BB430961, 
BE232162, BQ121419, BQ121418, BG591509, BF457670, AL897593, 
AL897592, BM926692, BM538559, BI759567, AL601021, AL598780, 
AU222540, BG567619, AU 166296, BF889835, AU164011, AV656025, 
BF343454, AW262441, AW237952. Ces sequences, obtenues dans le cadre 
d'un programme de sequencage en masse de banques d'ADN complemen- 
taires humains, sont incompletes et n'ont jamais ete ni reconnues ni caracteri- 
sees. En fait, le polynucleotide isole par les Inventeurs presente de longs, 
enchamements de desoxyadenosines (poly-dA), ce qui explique les difficultes 
rencontrees par les Inventeurs pour obtenir I'ADNc complet par utilisation 
d'amorces oligo-desoxythymidines (oligo-dT) classiques, celles-ci s'hybridant 
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de maniere aleatoire avec les enchamements poly-dA. C'est par (Utilisation 
repetee de la technique de ramplification rapide des extremites 3' d'ADNc (3 1 
Rapid Amplification cDNA end ou 3'RACE) que les Inventeurs sont parvenus 
a isoler le polynucleotide correspondant a I'ARNm complet. 
5 L'ARNm, correspondant au polynucleotide de sequence SEQ 

ID NO: 15, est specifiquement exprime dans le testicule sous la forme d'un 
polynucleotide d'une longueur d'environ 2,9 kilobases et dans le cerveau sous 
la forme d'un polynucleotide d'une longueur d'environ 9 kilobases pouvant 
correspondre soit a un premessager soit a une isoforme de haut poids mole- 
10 culaire. 

De maniere plus precise, lesdits exons sont repartis comme 
suit sur ladite sequence genomique (par rapport a la numerotation de la 
sequence SEQ ID NO: 16) : 

- exon 1 : il comprend 200 paires de bases correspondant aux 
15 positions 101 a 300 (SEQ ID NO: 17) ; 

- exon 2 : il comprend 139 paires de bases correspondant aux 
positions 1157 a 1295 (SEQ ID NO: 18) ; 

- exon 3 : il comprend 85 paires de bases correspondant aux posi- 
tions 2050 a 2134 (SEQ ID NO: 19) ; 

20 - exon 4 : il comprend 321 paires de bases correspondant aux 

positions 3615 a 3935 (SEQ ID NO: 20) ; 

- exon 5 : il comprend 227 paires de bases correspondant aux 
positions 8259 a 8485 (SEQ ID NO: 21) ; 

- exon 6 : il comprend 94 paires de bases correspondant aux posi- 
25 tions 14930 a 15023 (SEQ ID NO: 22) ; 

- exon 7 : il comprend 248 paires de bases correspondant aux 
positions 16715 a 16962 (SEQ ID NO: 23) ; 

- exon 8 : il comprend 71 paires de bases correspondant aux posi- 
tions. 1 9552 a 1 9622 (SEQ I D NO: 24) ; 

30 - exon 9 : il comprend 169 paires de bases correspondant aux 

positions 21 187 a 21355 (SEQ ID NO: 25) ; 
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- exon 10 : il comprend 90 paires de bases correspondant aux 
positions 21911 a 22000 (SEQ ID NO: 26) ; 

- exon 11 : il comprend 162 paires de bases correspondant aux 
positions 23731 a 23892 (SEQ ID NO: 27) ; 

5 - exon 12 : il comprend 146 paires de bases correspondant aux 

positions 24014 a 24159 (SEQ ID NO: 28) ; 

- exon 13 : il comprend 133 paires de bases correspondant aux 
positions 24343 a 24475 (SEQ ID NO: 29) ; 

- exon 14 : il comprend 485 paires de bases correspondant aux 
10 positions 29166 a 29650 (SEQ ID NO: 30). 

L'lnvention a aussi pour objet : 

un fragment de I'un quelconque des polynucleotides selon 
l'lnvention, d'au moins 15 a 1500 nucleotides consecutifs a I'exclusion des 
sequences repertories sous les numeros d'acces AK024730 et AK024812 et 

15 des EST repertories sous les numeros d'acces BU198882, BM693711, 
AW372449, BM021380, BU928828, AL707573, AI885274, AI671785, 
AA805679, BU619959, BM021126, AL598336, AW976973, BU629726, 
AI433877, AV751613, BQ372751, AI827535, AI866257, AA843565, R96130, 
BU684090, BF958121, BQ351941, AW1 94906, BG203580, BF078132, 

20 AW486134, AL600279, AA025538, AL600264, BF1 70676, BU759494, 
BB025236, BF214179, AI283076, BE694273, AI266380, BM670854, 
AA968415, BU503982, BB700612, BE988355, BU058357, BB312934, 
AW061311, BM537962, BE988356, BB318982, BB311217, BB557152, 
BB1 85248, BB557128, BB698742, BB1 86736, AV345769, BB274293, 

25 BB632007, BB617958, AI391312, W18534, BB1 86581, BB311289, 
BB312835, AW347411, AA972439, BB263570, AU035125, BB277226, 
BB274224, BB268445, AW024037, AA025609, BB274174, R96089, 
BB272238, BB269037, BB385718, BE007324, BB325992, AJ275277, 
AI414381, BB125476, BB430961, BE232162, BQ121419, BQ121418, 

30 BG591509, BF457670, AL897593, AL897592, BM926692, BM538559, 
BI759567, AL601021, AL598780, AU222540, BG567619, AU 166296, 
BF889835, AU164011, AV656025, BF343454, AW262441, AW237952 dans 
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la base de donnees GenBank, particulierement un fragment selectionne parmi 
les sequences correspondants aux exons c'est-a-dire selectionne parmi les 
sequences SEQ ID NO: 16 a SEQ ID NO: 30 ; 

un acide nucleique presentant un pourcentage d'identite 
5 d'au moins 80 %, de preference d'au moins 90 %, avec Tun des poly- 
nucleotides selon I'lnvention. 

La definition de Tidentite d'une sequence donnee precedem- 
ment pour les proteines, s'applique par analogie aux molecules d'acide 
nucleique. 

10 Sont inclus dans un polynucleotide presentant un pourcentage 

d'identite d'au moins 80 %, de preference au moins 90 %, selon I'lnvention, 
les polynucleotides variants des sequences SEQ ID NO: 15 et 45, c'est-a-dire 
I'ensemble des polynucleotides correspondants a des variants alleliques, 
c'est-a-dire a des variations individuelles des sequences SEQ ID NO: 15 et 

15 45. Ces sequences variantes naturelles correspondent a des polymorphismes 
presents chez les mammiferes, en particulier chez I'etre humain et, notam- 
ment a des polymorphismes pouvant conduire a la survenue d'une pathologie. 

On entend egalement designer par polynucleotide variant, tout 
ARN ou ADNc resultant d'une mutation et/ou d'une variation d'un site 

20 d'epissage de la sequence genomique dont TARNm a comme ADN comple- 
mentaire le polynucleotide de sequence SEQ ID NO: 15 ou SEQ ID NO : 45. 

De preference, la presente Invention concerne les poly- 
nucleotides ou les fragments variants des sequences SEQ ID NO: 15 et 45, 
particulierement ceux dans lesquelles les mutations conduisent a une modifi- 

25 cation de la sequence en acides amines des proteines de sequence SEQ ID 
NO: 1 et SEQ ID NO : 46. 

Les polynucleotides selon Tlnvention peuvent etre isoles a 
partir de cellules, particulierement des cellules de testicule ou de cerveau ou a 
partir de banques dADN cellulaire. lis peuvent egalement etre obtenus par 

30 une reaction de polymerisation en chame (PCR) effectuee sur TADN total des 
cellules ou encore par RT-PCR effectuee sur les ARN totaux des cellules ou 
par synthese chimique. 
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Les polynucleotides selon I'lnvention, particulierement les 
fragments de Tun quelconque des polynucleotides selon I'lnvention, et les 
sequences repertoriees sous les numeros d'acces AK024730 et AK024812 et 
les EST repertories sous les numeros d'acces BU1 98882, BM693711, 
AW372449, BM021380, BU928828, AL707573, AI885274, AI671785, 
AA805679, BU619959, BM021126, AL598336, AW976973, BU629726, 
AI433877, AV751613, BQ372751, AI827535, AI866257, AA843565, R96130, 
BU684090, BF958121, BQ351941, AW194906, BG203580, BF078132, 
AW486134, AL600279, AA025538, AL600264, BF1 70676, BU759494, 
BB025236, BF214179, AI283076, BE694273, AI266380, BM670854, 
AA968415, BU503982, BB700612, BE988355, BU058357, BB312934, 
AW061311, BM537962, BE988356, BB318982, BB311217, BB557152, 
. BB1 85248, BB557128, BB698742, BB1 86736, AV345769, BB274293, 
V BB632007, BB617958, AI391312, W18534, BB186581, BB311289, 
BB312835, AW347411, AA972439, BB263570, AU035125, BB277226,' 
BB274224, BB268445, AW024037, AA025609, BB274174, R96089, 
BB272238, BB269037, BB385718, BE007324, BB325992, AJ275277, 
AI414381, BB125476, BB430961, BE232162, BQ121419, BQ121418, 
BG591509, BF457670, AL897593, AL897592, BM926692, BM538559, 
BI759567, AL601021, AL598780, AU222540, BG567619, AU166296, 
BF889835, AU164011, AV656025, BF343454, AW262441, AW237952 dans 
la base de donnees GenBank ou leurs fragments, peuvent notamment etre 
utilises comme sondes ou comme amorces pour detecter/amplifier des poly- 
nucleotides (ARN ou ADN genomique) correspondants au polynucleotide 
selon I'lnvention, particulierement dans d'autres organismes. 

Les transcrits du gene asap sont par exemple de preference 
mis en evidence a I'aide de sondes selectionnees dans le groupe constitue 
par les sequences SEQ ID NO: 15, SEQ ID NO : 45, SEQ ID NO: 17 a SEQ 
ID NO: 44 ou a I'aide d'un EST tel que defini ci-dessus ou amplifies par RT- 
PCR a I'aide d'amorces selectionnees dans le groupe constitue par les 
sequences SEQ ID NO: 31 a 43. 
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Le polynucleotide selon Nnvention peut permettre de 
diagnostiquer un etat pathologique ou une maladie genetique impliquant un 
dysfonctionnement du gene asap et de cribler des substances capables de 
moduler (activer ou inhiber) la transcription dudit gene. 
5 L'lnvention a aussi pour objet les polynucleotides susceptibles 

d'etre obtenus par amplification a 1'aide des amorces selon l'lnvention. 

Les sondes et amorces selon Nnvention peuvent etre 
marquees directement ou indirectement par un compose radioactif ou non 
radioactif par des methodes bien connues de I'homme du metier, afin d'obtenir 
10 un signal delectable et/ou quantifiable. 

Le marquage des sondes selon ('Invention est realise par des 
elements radioactifs ou par des molecules non radioactives. Parmi les iso- 
topes radioactifs utilises, on peut citer le 32 P, le 33 P, le 35 S, le 3 H ou l f125 l. Les 
entites non radioactives sont selectionnees parmi les ligands tels que la 
15 biotine, i'avidine, la streptavidine, la digoxygenine, les haptenes, les colorants, 
les agents luminescents tels que les agents radioluminescents, chemo- 
luminescents, bioluminescents, fluorescents, phosphorescents. 

Les polynucleotides selon Hnvention peuvent ainsi etre utili- 
ses comme amorce et/ou sonde dans des procedes mettant en oeuvre 
20 notamment la technique de PCR (amplification en chame par polymerase) 
(U.S. N° 4,683,202). D'autres techniques d'amplification de Pacide nucleique 
cible peuvent etre avantageusement employees comme alternative a la PCR 
II existe actuellement de tres nombreux procedes permettant cette amplifica- 
tion, comme par exemple la technique SDA (Strand Displacement Amplifica- 
25 tion) ou technique d'amplification a deplacement de brin, la technique TAS 
(Transcription-based Amplification System), la technique 3SR (Self-Sustained 
Sequence Replication), la technique NASBA (Nucleic Acid Sequence Based 
Amplification), la technique TMA (Transcription Mediated Amplification), la 
technique LCR (Ligase Chain Reaction), la technique de RCR (Repair Chain 
30 Reaction), la technique CPR (Cycling Probe Reaction), la technique d'amplifi- 
cation a la Q-beta-replicase. On peut encore citer la PCR-SSCP qui permet 
de detecter des mutations ponctuelles. 
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Ces techniques sont bien entendu parfaitement connues de 
Thomme du metier. 

Comme sondes ou comme amorces, les differents poly- 
nucleotides selon Tlnvention peuvent permettent, soit de determiner le profil 
5 de transcription du gene asap correspondant ou une eventuelle alteration de 
ce profil dans un echantillon biologique, soit de mettre en evidence le gene 
correspondant dans d'autres especes, des variants alleliques de ce gene ou 
une eventuelle alteration fonctionnelle de ce gene (changement substantiel 
dans Tactivite de la proteine codee par ledit gene) resultant d'une mutation 
10 (insertion, deletion ou substitution) d'un ou plusieurs nucleotides au niveau 
d'au moins un exon dudit gene. De telles mutations incluent en particulier les 
deletions, les insertions ou les substitutions non-conservatives au niveau de 
t, codons correspondant a des residus d'acides amines situes dans un domaine 
t essentiel pour Tactivite biologique de la proteine. 
15 Ainsi Tlnvention a pour objet une methode de determination: 

du profil de transcription du gene correspondant au polynucleotide selon 
Tlnvention ou d'une alteration dudit profil, dans un echantillon biologique, 
\ comprenant une premiere etape d'obtention par tout moyen approprie des 
: ARN totaux a partir de Techantillon biologique, une deuxieme etape de mise^ 
20 en contact desdits ARN. avec une sonde selon Tlnvention, prealablement 
marquee, dans des conditions classiques d'hybridation entre les ARN et la 
sonde et une troisieme etape de revelation par tout moyen approprie des 
hybrides formes. 

Par conditions classiques d'hybridation, on entend celles 
25 decrites dans Sambrook J, Russell DW. (2000) Cold Spring Harbor Laboratory 
Press. 

Selon un mode de mise en oeuvre de ladite methode, la 
deuxieme etape peut etre une etape de transcription inverse et d'amplification 
des transcrits, realisee a Taide d'une paire d'amorces telles que decrites 
30 precedemment et la troisieme etape, une etape de revelation par tout moyen 
approprie des acides nucleiques amplifies formes. 
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Ladite methode de determination du profil de transcription du 
gene peut en outre comporter une etape devaluation du taux de transcription 
du gene par comparaison avec un echantillon temoin prealablement choisi. 
Ledit temoin peut etre constitue par exemple par un echantillon biologique 
5 presentant une transcription normale ou alteree du gene correspondant au 
polynucleotide selon Tlnvention auquel ladite methode de determination du 
profil de transcription du gene est appliquee dans les memes conditions. 

L'lnvention a aussi pour objet une methode de mise en 
evidence dans d'autres especes du gdne correspondant au polynucleotide 
10 selon Tlnvention ou des variants alleliques dudit gene ou d'une alteration 
fonctionnelle de ce gene, dans un echantillon biologique, comprenant une 
premiere etape d'obtention par tout moyen approprie de TADN a partir des 
cellules d'un echantillon biologique, une deuxieme etape de mise en contact 
desdits ADN avec une sonde selon Tlnvention, prealablement marquee, dans 
15 des conditions classiques d'hybridation entre les ADN et la sonde et une 
troisieme etape de revelation par tout moyen approprie des hybrides formes. 

Selon un mode de mise en oeuvre de ladite m6thode, la 
deuxieme etape peut etre une etape d'amplification realisee a Taide d'une 
paire d'amorces telles que decrites precedemment et la troisieme etape, une 
20 etape de revelation par tout moyen approprie des acides nucleiques amplifies 
formes. La methode peut eventuellement comporter une quatrieme etape 
d'isolement et de sequengage des acides nucleiques mis en evidence. 

Ulnvention a egalement pour objet une trousse de reactifs 
pour la mise en oeuvre des methodes precedemment decrites comprenant : 
25 a) au moins une sonde ou une paire d^morces selon Tlnven- 

tion ; . 

b) les reactifs necessaires a la mise en oeuvre d'une reaction 
classique d'hybridation entre ladite sonde ou lesdites amorces et Tacide 
nucleique de Techantillon biologique ; 
30 c) les reactifs necessaires a la mise en oeuvre d'une reaction 

d'amplification ; 
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d) les reactifs necessaires a la detection et/ou au dosage de 
Thybride forme entre ladite sonde et Tacide nucleique de I'echantillon 
bioiogique ou des acides nucleiques amplifies formes. 

Une telle trousse peut egalement contenir des controles posi- 
tifs ou negatifs afin d'assurer la qualite des resultats obtenus. Elle peut ega- 
lement contenir les reactifs necessaires a la purification des acides nucleiques 
a partir de Techantillon bioiogique. 

Le polynucleotide de Tlnvention ou un de ses fragment, ainsi que les EST 
decrits precedemment ou leur fragments peuvent servir a la mise au point de 
rnodeles cellulaires ou animaux n'exprimant pas la proteine ASAP, en invali- 
dant le gene ASAP par la methode de Si RNA (ou RNAi pour RNA inter- 
ference ; M. McManus and P. Sharp, Nature Reviews Genetics, 3, 737-747, 
2002; V. Brondani, F. Kolb, E. Billy, M/S, 6-7, 665-667, 2002) a I'aide 
d'oligonucleotides derives de leurs sequences. 

L'lnvention a egalement pour objet un vecteur de clonage 
et/ou d'expression dans lequel est insere le polynucleotide selon Tlnvention. 

Un tel vecteur peut contenir les elements necessaires a 
Texpression et eventuellement a la secretion de la proteine dans une cellule 
hote. 

Lesdits vecteurs comportent de preference : un promoteur, 
des signaux d'initiation et de terminaison de la traduction, ainsi que des 
regions appropriees de regulation de la transcription, lis doivent pouvoir etre 
maintenus de fagon stable dans la cellule et peuvent eventuellement 
comprendre des sequences codant pour des signaux particuliers specifiant la 
secretion de la proteine traduite tels que par exemple un promoteur fort de 
nature ubiquitaire ou un promoteur selectif d'un type de cellule et/ou de tissu 
particulier. Ces differentes sequences de controle sont choisies en fonction de 
Thote cellulaire utilise. 

Le polynucleotide selon l'lnvention peut etre insere dans des 
vecteurs a replication autonome au sein de Thote choisi ou des vecteurs inte- 
grals de Thote choisi. 
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Parmi les systemes a replication autonome, on utilise de 
preference en fonction de la cellule hote, des systemes de type plasmidique 
ou viral. Les vecteurs viraux peuvent notamment etre des adenovirus, des 
retrovirus, des lentivirus, des poxvirus ou des virus herpetiques. L'homme du 
5 metier connalt les technologies utilisables pour chacun de ces systemes. 

Lorsque Ton souhaite Integration de la sequence dans les 
chromosomes de la cellule hote, on peut utiliser par exemple des systemes de 
type plasmidique ou viral ; de tels virus sont, par exemple, les retrovirus ou les 
virus associes aux adenovirus (Adeno-associated virus ou AAV). 

10 Parmi les vecteurs non viraux, on prefere les polynucleotides 

nus tels que I'ADN ou TARN nu, les chromosomes artificiels de bacterie (BAC, 
bacterial artificiel chromosome), les chromosomes artificiels de levure (YAC, 
yeast artificiel chromosome) pour I'expression dans la levure, les chromo- 
somes artificiels de souris (MAC, mouse artificial chromosome) pour Texpres- 

15 sion dans les cellules murines et de maniere preferee les chromosomes artifi- 
ciels d'homme (HAC, human artificial chromosome) pour I'expression dans les 
cellules humaines. 

De tels vecteurs sont prepares selon les methodes couram- 
ment utilisees par I'homme du metier, et les vecteurs recombinants en resul- 

20 tant peuvent etre introduits dans I'hote approprie par des methodes standards, 
telles que par exemple la lipofection, I'electroporation, le choc thermique, la 
transformation apres permeabilisation chimique de la membrane, la fusion 
cellulaire. 

L'lnvention a aussi pour objet les cellules hotes transformees, 
25 notamment les cellules eucaryotes et procaryotes, dans lesquelles au moins 
un polynucleotide ou un fragment selon l'lnvention ou au moins un vecteur 
selon l'lnvention a ete introduit. 

Parmi les cellules utilisables aux sens de la presente 
Invention, on peut citer les cellules bacteriennes, les cellules de levure, les 
30 cellules animates, en particulier les cellules de mammiferes ou encore les 
cellules vegetales. On peut citer egalement les cellules d'insectes dans 



WO 2004/058815 



PCT/FR2003/003895 



23 

lesquelles on peut utiliser des procedes mettant par exemple en oeuvre des 
baculovirus. 

L'lnvention a egalement pour objet les organismes trans- 
geniques non-humains tels que les animaux ou les vegetaux transgeniques, 
5 dont tout ou partie des cellules contient le polynucleotide selon l'lnvention ou 
le vecteur selon l'lnvention, sous une forme libre ou integree. 

De preference selon l'lnvention, les organismes transgeniques 
non-humains sont ceux porteurs de cellules contenant un polynucleotide selon 
l'lnvention, non fonctionnel ou porteur d'une mutation. 
10 Selon l'lnvention les animaux transgeniques sont de prefe- 

rence des mammiferes, excepte I'homme, plus preferentiellement les 
rongeurs, en particulier les souris ou les rats. 
- Les animaux transgeniques peuvent etre obtenus par toute 

- : methode classique connue de I'homme du metier, comme par exemple par 
15 recombinaison homologue sur cellules souches embryonnaires, transfer! de ? 
ces cellules souches a des embryons, selection des chimeres affectees au 
niveau des lignees reproductrices, et croissance desdites chimeres. 
: Les cellules hotes transformees, les animaux ou les vegetaux 

transgeniques selon l'lnvention peuvent ainsi exprimer ou surexprimer le gene^ 
20 codant pour la proteine selon l'lnvention ou leur gene homologue ou exprimer 
ledit gene dans lequel est introduite une mutation. 

Les cellules de testicule ou de cerveau, les cellules hotes 
transformees ou les organismes transgeniques selon l'lnvention peuvent etre 
utilises pour la preparation de la proteine selon l'lnvention. 
25 La proteine selon l'lnvention, particulierement la proteine 

ASAP native, peut etre purifiee selon les techniques connues de I'homme du 
metier. Ainsi, la proteine peut etre purifiee a partir de lysats et extraits cellu- 
laires, du surnageant du milieu de culture, par des methodes utilisees indivi- 
: duellement ou en combinaison, telles que le fractionnement, les methodes de 
30 chromatographie, particulierement de chromatographie d'affinite, les 
techniques d'immunoaffinite a I'aide d'anticorps monoclonaux ou polyclonaux 
specifiques, etc... 
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^Invention a egalement pour objet une methode de prepara- 
tion de la proteine ASAP, se caracterisant en ce que Ton cultive des cellules 
exprimant la proteine ou des cellules transformees selon la presente Inven- 
tion, notamment les cellules de mammiferes ou les cellules d'organismes 
5 transgeniques selon Plnvention, dans des conditions permettant Pexpression 
de ladite proteine, et que Ton purifie ladite proteine. 

Comme technique de purification, on peut citer par exemple la 
chromatographie d'affinite sur glutathione-sepharose (ou agarose) telle que 
decrite dans Sambrook J & Russell DW. (2000, Cold Spring Harbor 
10 Laboratory Press). 

U Invention a egalement pour objet une proteine, caracterisee 
en ce qu'elle est susceptible d'etre obtenue par Tune quelconque des 
methodes de preparation ci-dessus decrites. 

^Invention a encore pour objet une methode de criblage 
15 d'une substance capable d'interagir in vitro, directement ou indirectement, 
avec le polynucleotide ou la proteine selon Plnvention caracterisee en ce que : 

dans une premiere etape on met en contact la substance 
a tester et le polynucleotide ou la proteine selon Plnvention et 

dans une deuxieme etape on detecte par tout moyen 
20 approprie le complexe forme entre ladite substance et le polynucleotide ou la 
proteine selon Plnvention. 

La presente invention a egalement pour objet une methode de 
criblage d'une substance capable de moduler (activer ou inhiber) Pactivite de 
la proteine ASAP, caracterisee en ce que : 
25 - dans une premiere etape on met en contact des cellules d'un 

echantillon biologique exprimant la proteine ASAP avec une substance a 
tester, 

- dans une deuxieme etape on mesure par tout moyen appro- 
prie Teffet de ladite. substance sur Pactivite de ladite proteine ASAP, et 
30 - dans une troisieme etape on selectionne des substances 

capables de moduler ladite activite. 
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Au sens de la presente invention, on entend par activite de la 
proteine ASAP, aussi bien Texpression de la proteine ASAP ou des transcrits 
(ARNm) correspondants, que Tactivite biologique de ladite proteine ASAP, 
comme par exemple son effet sur Torganisation du fuseau mitotique ou 
5 Tinduction de mitoses aberrantes et abortives. 

La detection du complexe forme entre ladite substance et le 
polynucleotide ou la proteine ou la mesure de Teffet de ladite substance sur 
Tactivite de ladite proteine ASAP peuvent etre realisees par les techniques 
classiques d'analyse d'ARNm ou de proteines qui sont connues en 
10 elles-memes ; a titre d'exemple non-limitatif, on peut citer les techniques 
suivantes : RT-PCR, Northern-blot, Western-blot, RIA, ELISA, immunopreci- 
pitation, techniques d'analyse immunocytochimique ou immunohistochimique. 
~ Avantageusement, ladite mesure est realisee a Taide des 

. sondes, des amorces ou des anticorps, tels que definis ci-dessus. 
15 : De telles substances peuvent etre des macromolecules^ 

biologiques comme par exemple un acide nucleique, un lipide, un sucre, une 
proteine, un peptide, un compose hybride proteine-lipide, proteine-sucre, 
peptide-lipide ou peptide-sucre, une proteine ou un peptide sur lequel on a 
ajoute des ramifications chimiques ou encore des molecules chimiques. % 
20 L'lnvention a egalement pour objet le polynucleotide, la 

proteine, les anticorps, les vecteurs ou les cellules transformees selon Inven- 
tion, utilises comme medicaments. 

Comme indique precedemment, la surexpression de la 
proteine selon Tlnvention bloque la division cellulaire et par consequent la 
25 proliferation cellulaire. Cela en fait un excellent candidat pour une utilisation 
comme agent anti-mitotique, utilisable par exemple dans le traitement des 
pathologies cancereuses. 

Ainsi, Tlnvention a egalement pour objet I'utilisation du poly- 
nucleotide, d'un vecteur ou de la proteine selon Tlnvention, dans la prepara- 
30 tion d'un medicament anti-mitotique. 

De meme comme il est egalement indique precedemment, la 
surexpression de la proteine selon Tlnvention entratne des perturbations dans 
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Torganisation du fuseau mitotique et induit des mitoses aberrantes et abor- 
tives (cellules plurinucleees, fuseaux mono- ou multipolaires). 

Ainsi, Tlnvention a aussi pour objet Tutilisation d'un poly- 
nucleotide anti-sens ou d'un fragment anti-sens, d'un anticorps, d'un vecteur 

5 contenant un oligonucleotide anti-sens selon Tlnvention, capables d'inhiber 
Texpression du polynucleotide ou de la proteine selon Tlnvention, dans la 
preparation d'un medicament destine au traitement des pathologies liees aux 
perturbations dans Torganisation du fuseau mitotique et/ou a une induction 
des mitoses aberrantes et abortives (cellules plurinucleees, fuseaux mono- ou 

10 multipolaires) liees a la surexpression de la proteine selon Tlnvention. 

Outre les dispositions qui precedent, Tlnvention comprend 
encore d'autres dispositions qui ressortiront de la description qui va suivre, qui 
se refere a des exemples de mise en oeuvre de Tlnvention ainsi qu'aux 
dessins annexes, dans lesquels : 

15 - La Figure 1 represente la localisation chromosomique et la 

structure du gene asap humain. 

- La Figure 2 represente les signaux obtenus par Northern 
blots sur differents tissus humains apres hybridation avec une sonde hASAP. 

- La Figure 3 represente les resultats obtenus : 

20 (A) par 6lectrophorese sur gel d'agarose des produits de 

RT-PCR obtenus avec des amorces correspondant au polynucleotide de 
souris, orthologue du polynucleotide SEQ ID NO: 15, a partir de differents 
tissus de souris. 

(B) Apres transfer! du gel apres electrophorese sur une 
25 membrane et hybridation avec une sonde mASAP interne. 

- La Figure 4 represente la localisation cellulaire de la proteine 
hASAP couplee a la Green Fluorescent Protein (GFP) en 3' ou la Yellow 
Fluorescent Protein (YFP) en 5' ou a un tag MYC du cote N-terminal (colonne 
fusion). 

30 Les noyaux sont colores a Tiodure de propidium ou au 

Hoechst 33286. (4A : objectif 63x ; 4B, 4C, 4D : objectif I00X). 

- La Figure 5 montre la co-localisation de la proteine ASAP 
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humaine avec I'alpha-tubuline. Figure 5 A : localisation cellulaire de I'alpha- 
tubuline, Figure 5 B : localisation de la proteine ASAP, Figure 5 C : superposi- 
tion des 2 images montrant la colocalisation des 2 proteines. 

Les exemples suivants sont illustratifs de I'lnvention et ne la 
5 limitent aucunement. 

EXEMPLE 1 : Construction de la sequence codante ASAP complete : 

On amplifie la sequence complete de I'ADNc de la proteine 
ASAP a partir de 2 fragments chevauchants : 

- un fragment A amplifie par PCR a partir du clone AI885274 
10 avec les amorces : 

constFIS-1 F (S'-ATGTCTGATGAAGTTTTTAGCACC-S') (SEQ 

ID NO: 31) et 

constFIS-2R (S'-AGGCCTCAAATGATGCTAATGC-S') (SEQ 

ID NO: 32); 

15 - un fragment B amplifie a partir du clone AI671785 avec les 

amorces : 

constFIS-2F (S'-ATCATTTGAGGCCTGGAAGGC-S') (SEQ ID 

NO: 33) et 

et constFIS-1R (5 , -AAACACTTTTGCGAACACAGTTC-3 , ) 
20 (SEQ ID NO: 34). 

Puis, pour obtenir un produit PCR unique correspondant a la 
sequence complete de I'ADNc de la proteine ASAP, utilisable pour les expe- 
riences de fonction, 0,5 pi des produits de chacune des 2 reactions PCR 
(fragment A et B) sont hybrides ensemble a 25°C puis amplifies avec les 
25 amorces constFIS-1F et constFIS-2F. Ce produit PCR est sous-clone dans le 
vecteur PCR4 suivant les recommandations du fabricant (Invitrogen) et verifie 
par sequengage. 

Les difficultes majeures rencontrees se sont situees dans la 
determination in silico de la sequence codante complete ASAP et de sa 
30 reconstruction in vitro. En particulier, le choix des amorces et des differentes 
PCR de la region 3' ont ete delicats en raison de la richesse de la sequence 
en polyA. 
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EXEMPLE 2 : Analyse bio-informatique 

La Figure 1 represente la localisation chromosomique et la 
structure du gene asap humain. 

L'organisation complete du gene asap et sa localisation 
5 chromosomique ont ete obtenues en comparant la sequence de I'ADNc 
obtenu a I'exemple 1, a la sequence du genome humain en utilisant les 
programmes du Wellcome Trust Sanger Institute 
(httl2://www.ensembl.oriz/genome/central/ et plus precisement le programme 
de recherche BLAST (htip://genome.cse.ucsc.edu/). 

10 Le gene humain asap est constitue de 29750 nucleotides 

comprenant 14 exons dont 13 seulement sont traduits, le premier exon n'etant 
pas traduit. La taille des exons s'echelonne de 71 a 321 paires de bases. La 
sequence du gene est contenue dans le contig AC097467 (longueur 178204 
paires de bases) entre les bases 115117 et 143828 (version v.7.29a3 

15 NCBI/Ensembl du 12 juillet 2002, http ://www. ensembl.org), et est par ailleurs 
localisee sur le chromosome 4q32.1 entre les marqueurs anonymes D4S1053 
et D4S571 (region 161,25 Megabases (Mb) a 161,28 Mb). La sequence du 
gene est physiquement contenue dans le clone BAC RP11-27G13. 

Deux acides nucleiques correspondants a des fragments du 

20 polynucleotide isole par les Inventeurs sont repertories dans la base de 
donnees GenBank sous les numeros d'acces AK024730 et AK024812, ainsi 
que les EST repertories sous les numeros d'acces BU1 98882, BM693711, 
AW372449, BM021380, BU928828, AL707573, AI885274, AI671785, 
AA805679, BU619959, BM021126, AL598336, AW976973, BU629726, 

25 AI433877, AV751613, BQ372751, AI827535, AI866257, AA843565, R96130, 
BU684090, BF958121, BQ351941, AW1 94906, BG203580, BF078132, 
AW486134, AL600279, AA025538, AL600264, BF1 70676, BU759494, 
BB025236, BF214179, AI283076, BE694273, AI266380, BM670854, 
AA968415, BU503982, BB700612, BE988355, BU058357, BB312934, 

30 AW061311, BM537962, BE988356, BB318982, BB311217, BB557152, 
BB185248, BB557128, BB698742, BB186736, AV345769, BB274293, 
BB632007, BB617958, AI391312, W18534, BB186581, BB311289, 
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BB312835, AW347411, AA972439, BB263570, AU035125, BB277226, 
BB274224, BB268445, AW024037, AA025609, BB274174, R96089, 
BB272238, BB269037, BB385718, BE007324, BB325992, AJ275277, 
AI414381, BB125476, BB430961, BE232162, BQ121419, BQ121418, 
5 BG591509, BF457670, AL897593, AL897592, BM926692, BM538559, 
BI759567, AL601021, AL598780, AU222540, BG567619, AU166296, 
BF889835, AU1 64011, AV656025, BF343454, AW262441, AW237952. Ces 
sequences, obtenues dans le cadre d'un programme de sequencage en 
masse de banques d'ADN complementaires humains, sont incompletes et 

10 n'ont jamais ete ni reconnues ni caracterisees. 

La sequence proteique a ete comparee aux sequences des 
banques de donnees en utilisant les programmes PSI-BLAST et PHI-BLAST 
a du NCBI (http://www.ncbi.nlm.nih.gov/Sitemap/). Des motifs proteiques 
.r consensus ont ete recherches en utilisant les programmes DART du NCBI et 

15 ; SMART d'ExPASy-Tools (http://www.expasy.ch/tools/#similariw), dont les c 
parametres permettent de detecter des motifs de faible homologie. La 
proteine ASAP presente une identite de sequence de 23% sur le tiers 
C-terminal avec une proteine associee aux microtubules (MAP 1A pour 
Microtubule-Associated-Protein 1A). Par ailleurs la recherche de motifs 

20 conserves (DART on SMART) revele des domaines de type caldesmon 
(Gusev, N.B., Biochemistry, 10 1112-1121, 2000) et ERM 
(Ezrin/radixin/moesin) (Louvet-Vallet, S., Biol. Cell, 274 : 305-316, 2000), qui 
sont des proteines egalement considerees comme des MAPs, avec des 
identites d'environ 20%. Elle presente egalement un domaine BRCT (Breast 

25 cancer carboxy-terminal domain; Bork, P., et coll., FASEB J., 11, 68-76 
(1997)) entre les positions 65 et 303. 

La proteine ASAP presente des domaines coiled-coil essen- 
tiellement regroupes dans sa partie C-terminale entre les acides amines 297 
et 327 d'une part et 477 et 628 d'autre part, indiquant soit que la proteine 

30 s'oligomerise, soit qu'elle interagit avec d'autres proteines. 

L'analyse informatique de la proteine a I'aide des programmes 
accessibles dans le site internet (http://npsa-bil.ibcp.fr/cgi- 
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bin/npsa_automat.pl?page=/NPSA/npsa_secons.html), revele I'absence de 
feuillet p et une tres grande richesse en helices a, en particulier pour la region 
comprise entre les acides amines 420-620, presque exclusivement formees 
d'helices a. 

5 Ces elements permettent de penser que la proteine ASAP est 

une nouvelle MAP. 
EXEMPLE 3 : Expression tissulaire 
a) Analyse par Northern blot 

Preparation des sondes radioactives : 

10 Les ADN a radiomarquer sont isoles sur gel a bas point de 

fusion (LMP) selon la technique decrite dans Rouquier, S. et aL, (Genomics, 
17, 330-340, (1993)). Environ 100 ng d'ADN ainsi isole, sont marrques par 
amorgage aleatoire (fragment de Klenow, Promega) en presence de [a 32 P 
dCTP] (Amersham) selon la technique decrite dans Feinberg, A. P. & 

15 Vogelstein, B., (Anal. Biochern., 132, 6-13, (1983)). Ces sondes sont purifiees 
sur des colonnes de Sephadex G-50 selon la technique decrite dans 
Sambrook J & Russell DW. (2000, Cold Spring Harbor Laboratory Press). Les 
hybridations s'effectuent durant la nuit en presence de 2.10 6 Cpm/ml de sonde 
radioactive denature. 

20 a. 1 ) Hybridation 

Deux membranes Northern Blot de la societe Clontech, 
(Human MTN Blot at Human MTN Blot II, Ref. 7760-1 et 7759-1) comportant 
des ARNm humains de differents tissus ont ete hybridees avec PADNc hASAP 
complet marque comme decrit ci-dessus. La membrane est hybridee en 

25 presence de formamide a 42°C, en suivant le protocole Clontech. Un controle 
d'hybridation de la membrane est realise avec une sonde actine. La 
membrane est rincee 2 fois a haute stringence en 0,1X SSC/0,1% SDS a la 
temperature de 42°C, pendant 15 minutes. Les membranes sont alors analy- 
sees par autoradiographie ou au Phdsphorimager. 

30 Les tissus testes sont : la rate, le thymus, la prostate, le testi- 

cule, Tovaire, Tintestin grele, le colon, les leucocytes sanguins, le cceur, le 
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cerveau, le placenta, le poumon, le foie, le muscle squelettique, le rein et le 
pancreas. 

a. 2) Resultats 

La Figure 2 illustre ces resultats. 
Deux signaux sont detectes : 
.- un signal dans le testicule a environ 2,6 kb, ce qui correspond a 
la taille de I'ARNm ; 

- un signal dans le cerveau mais a un haut poids moleculaire (9 
kb) qui correspond soit a un premessager, soit a une isoforme de haut poids 
moleculaire 

b) Analyse par RT-PCR 

Cette analyse a ete effectuee sur des ARNs totaux de drffe- 
v. rents tissus de souris, a savoir le cerveau, le coeur, le colon, le foie, I'intestin 
grele, le muscle squelettique, le pancreas, le poumon, le rein, la rate et le 
testicule. 

b. 1) Qbtentjon de i;AD^ 

Les ARNs totaux de cellules de differents tissus de souris sont 
extraits avec le "mammalian total RNA kit" de la societe Sigma. Les ARN sont 
retro-transcrits avec le kit Superscript II de la societe Invitrogen selon les 
conditions prescrites par le fournisseur et en utilisant des amorces oligodT. 
Les produits obtenus sont verifies par electrophorese sur gel d'agarose a l%. 
1 pi de chaque echantillon ainsi obtenu est a son tour amplifie par PCR (25 pi 
de milieu de reaction, 30 cycles (94°C pendant 15 secondes, 55°C pendant 30 
secondes, 72°C pendant 30 secondes)) avec des amorces specifiques du 
genes asap de souris (mFIS-1F, 5'-ACA ACG AAT AAC AGA GTG TCC-3' 
(SEQ ID NO: 35) et mFIS-2R, 5-ACT CCT GAT AAA CAG CTG CC-3' (SEQ 
ID NO: 36). 

Les produits amplifies obtenus sont analyses par electro- 
phorese sur gel d'agarose a 1%, colores au bromure d f ethydium et leur taille 
comparee a un marqueur de taille depose sur le gel en parallele. 

Apres electrophorese, les produits amplifies obtenus sont 
transferes par capillarite sur membrane de nylon chargee, dans le tampon 
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NaCI 1,5M/NaOH 0 f 5M, selon la technique de Southern (transfer! alcalin). La 
membrane est ensuite hybridee avec une sonde radiomarquee mASAP, (SEQ 
ID NO: 44), generee par amplification de la sequence contenue dans le clone 
de souris AW06131 selectionne apres comparaison de la sequence ASAP 
5 humaine dans les banques de donnees (GenBank) 
(http://expression.gnf.org/promoter/tissue/images/41739_s_at.png). 

L'amplification a ete realisee par PCR (conditions telles que 
decrites ci-dessus dans lesquelles le volume de reaction est de 50 pi et le 
dCTP froid est a la concentration de 10 pM supplements avec 50 pCi d'a-P 32 - 

10 dCTPa 3000Ci/mmole), en utilisant les amorces rnFIS-1F (SEQ ID NO: 35) et 
mFis-2R (SEQ ID NO: 36). Les hybridations sont realisees a 65°C (dans du 
tampon 6X SSC/0,5% SDS/5X Denhardt). La membrane est rincee a forte 
stringence (0,IX SSC/0.1% SDS), puis analysee par autoradiographie ou au 
Phosphorlmager. 

15 b.2) Resu[tats 

La Figure 3 illustre ces resultats. 

On constate qu'on obtient un signal majoritaire dans le testi- 
cule et le cerveau, nettement visible sur gel (Figure 3A). 

Apres transfer! du gel et hybridation avec une sonde interne, 
20 on constate que Ton detecte un signal tres faible dans les autres tissus (Figure 
3B). 

Par consequent PARNm codant pour la proteine mASAP est 
majoritairement exprime dans le testicule et le cerveau. L'ADNc complet de 
souris, amplifie par RT-PCR a partir de TARN de testicule de souris, 
25 correspond a la sequence SEQ ID NO : 45 et la proteine correspondante 
(mASAP) a la sequence SEQ ID NO : 46. 
EXEMPLE 4 : Localisation cellulaire 

a) Sous-clonage de I'ADNc hASAP dans un vecteur d'expression eucarvote 

L'ADNc hASAP obtenu a Texemple 1 est insere dans trois 
30 vecteurs d'expression : 

1- dans pEAK10-EGFP en phase avec la Green Fluorescent 
Protein (GFP) fusionnee en C-terminal (vecteur 1) (pEAKIO, vecteur de Edge 
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Biosystems (distribue par Q.BIOgene, lllkirch en France) dans lequel a ete 
introduit la proteine EGFP (enhanced Green Fluorescent Protein) suivant la 
reference Gaillard, I., et aL, Eur. J. Neurosci., 15, 409-418, 2002) ; 

2- dans pEYFP-C1 en phase avec la Yellow Fluorescent 
5 Protein (YFP) fusionnee du cote N-terminal (vecteur 2) (distribue par BD 

Biosciences Clontech)) ; 

3- dans GLOMYC3-1 comportant un tag MYC du cote 
N-terminal (vecteur 3) , vecteur derive du vecteur pcDNA3.1 (Invitrogen), dans 
lequel ont ete inserees une region 5' non-traduite (5' UTR) et un tag MYC aux 

10 sites Hindlll-BamHI, et la region 3'UTR de la globine (fragment Spel-Xbal 

dans le site Xbal). 

L'ADNc hASAP est amplifie a partir de son vecteur de clonage 

initial (pCR4-TOPO) par PCR en utilisant la polymerase haute-fidelite pfu 

Turbo, a I'aide d'amorces amplifiant I'ADNc entre la methionine de depart et le 
15 dernier acide amine. Les produits amplifies obtenus sont sous-clones dans les 

3 vecteurs. 

- Clonage dans PEAK-GFP. Preparation de I'insert d'ADN 
par PCR [94°C 2 min ; (94°C 15 sec; 58°C 30 sec; 72°C 1min 30 sec) 30 
cycles ; 72°C 3 min.], a I'aide des amorces 
20 hFIS-Exp1F (S'-GCCACCATGTCTGATGAAGTTTTTAGCAC -3) (SEQ ID NO: 
37) et 

hFIS-Exp1R (5 , -GAAACACTTTTGCGAACACAGTTC-3 , ) (SEQ ID NO: 38). 

Le vecteur est coupe par EcoRV et dephosphoryle : 10 ng de 

vecteur sont utilises pour la ligation avec I'insert d'ADN. Le produit PCR est 
25 phosphoryle puis purifie sur high PURE PCR kit (Roche) : 100 ng d'insert sont 

utilises pour la ligation [12h a 16°C dans 10 pi final (ligase Biolabs), suivant 

les conditions standards (Sambrook and Russell)]. 

Clonage dans Glomyc : Preparation de I'insert d'ADN par 

PCR [94°C 2 min ; (94°C 15 sec; 60°C 30 sec; 72°C 1min 30 sec.) 30 
30 cycles ; 72°C 3 min.], a Taide des amorces : 

Glomyc-FIS1F : (5^TAATGTCTGATGAAGTTTTTAGCACC-3 , ) (SEQ ID NO: 

39) et 
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Glomyc-FIS1R : (5 , -TCAAAACACTTTTGCGAACACAGTTC-3 , ) (SEQ ID NO: 
40). 

Conditions de clonage identiques a celles decrites pour le 
clonage dans PEAK-GFP. 
5 - Clonage dans YFP : Preparation de I'insert d'ADN : memes 

conditions que pour Glomyc, a I'aide des amorces : 

YFP-FIS1F (5'-AATGTCTGATGAAG I I I I IAGCACC-3*) (SEQ ID NO: 41) et 
Glomyc-FIS1R (SEQ ID NO: 40) (cf ci-dessus). 

Conditions de clonage identiques a celles decrites pour le 
10 clonage dans PEAK-GFP, le vecteur ayant prealablement ete coupe par 
Sma1. 

Les recombinants sont analyses par PCR en utilisant une 
amorce du vecteur et une amorce interne. 

PEAK-GFP : annealing & 58°C, extension 45 sec. a 72°C. et conditions 
15 standards pour le reste. Amorces : constFIS-2F (SEQ ID NO: 33) et GFP-1R 
(S'-TCAGCTTGCCGTAGGTGGC-S') (SEQ ID NO: 42). 

YFP : annealing 55°C pendant 1 min. ; Amorces : YFP-2F (5'- 
ATGGTCCTGCTGGAGTTCG-3*) (SEQ ID NO: 43) et hFIS-Exp1R (SEQ ID 
NO: 38) . 

20 Glomyc : annealing 44°C, extension 45 sec. a 72°C. Amorces : constFIS-2F 
(SEQ ID NO: 33) et SP6. Les recombinants sont sequences par sequengage 
automatique a fagon a partir des produits PCR (Genome Express, Meylan). 

b) Sous-clonage de I'ADNc hASAP dans un vecteur d'expression procarvote 

En utilisant une strategie similaire a celle utilisee au para- 
25 graphe a) ci-dessus, TADNc hASAP a ete clone dans le vecteur pGEX-4T2 
(AMERSHAM), de fagon a produire une proteine de fusion avec la GST, 
purifiable selon les protocoles standards. 

c) Sous-clonage de TADNc mASAP dans un vecteur d'expression procarvote 
ou eucarvote , 

30 En utilisant une strategie similaire a celle utilisee au para- 

graphe a) ci-dessus, TADNc mASAP a ete clone dans les vecteurs suivants : 
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- pGEX-4T2, (AMERSHAM), de facon a produire une proteine 
de fusion avec la GST, purifiable selon les protocoles standards. 

- pEYFP-C1 de facon a produire une proteine de fusion (fusion 
N-terminale) avec la Yellow Fluorescent Protein (YFP) detectable par 
immunofluorescence directe. 

d) Transfection, im munofluorescence et microscopie 
d - 1) matgriejs et methodes 

Les vecteurs obtenus sont transfectes selon la technique au 
phosphate de calcium ou de facon plus routiniere en utilisant le precede 
jetPEI (GDSP10101, Qbiogene) suivant les recommandations du fabricant, 
dans les lignees cellulaires suivantes : 

- PEAK (ref. 37937, Edge Biosystems (distribue par 
Q.BIOgene, lllkirch en France), uniquement pour les constructions ASAP 
humaines, 

- HEK-293 (ATCC (American Tissue Culture Collection) refe^ 
rence CRL-1573 ; p53 -/- non synchronisable), pour les constructions ASAP 
humaines et murines, 

- NIH3T3 non-transformees (constructions ASAP murines), et 

- U-2 OS (ATCC HTB-96 ; p53 +/-, synchronisable) ■ 
Pour les vecteurs 1) et 2) (constructions ASAP humaines et 

murines), les localisations se font directement par detection de la fluorescence 
de la GFP ou de I'YFP a 24h, 48h et 72h apres fixation des cellules au para- 
formaldehyde et coloration des noyaux soit au propioiodure de propidium, soit 
au Hoechst 33286. 

Pour le vecteur 3) la detection du tag MYC est realisee a 
I'aide d'un anticorps primaire anti-MYC distribue par TEBU (9 E10, cat.#SC- 
40, Santa Cruz Biotechnology, CA) et d'un anticorps secondaire de chevre 
anti-IgG de souris marque au fluorochrome Alexa-594 (Molecular Probes, ref. 
A-11032, distribue en France par Interchim, Montlucon), apres la fixation des 
cellules et leur permeabilisation au Triton X100 0,1%. Les lames sont analy- 
sees, et les images collectees sur un microscope Zeiss Axiophot. 
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d-2) Resultats j..Loca!isatjpn.ceHu 

avec ralpha : tub 

- localisation cellulaire 

La Figure 4 illustre la localisation cellulaire de la proteine 
5 hASAP surexprimee dans la lignee HEK-293 (IP = lodure de propidium). 

L'observation au microscope a fluorescence des lames 
correspondant aux differentes transfections par les vecteurs 1), 2) et 3) 
montrent les memes types de profil : la localisation des proteines hASAP et 
mASAP est cytoplasmique et son profil fibreux rappelle celui des filaments de 
10 tubuline. 

Par ailleurs, il semble que les cellules transferees presentent 
des defauts de division car les noyaux sont toujours plus gros que dans les 
cellules non transferees (Figure 4A et 4B). De plus, certaines des cellules 
transferees semblent plurinucleees (Figure 4B). Ceci suggere une division 

15 anormale des cellules transferees. 

Enfin, la mitose des cellules transferees semble anormale, 
tant au niveau de ['organisation des chromosomes, que du profil de localisa- 
tion des proteines hASAP et mASAP au niveau du fuseau mitotique. Le profil 
de localisation des proteines hASAP et mASAP, en etoile, est caracteristique 

20 de la nucleation des microtubules en aster autour du centrosome (Figures 4C 
et 4D). 

Un profil similaire de localisation de la proteine ASAP est 
detecte dans la lignee U-2 OS (p53 +/-) surexprimant hASAP et dans la lignee 
NIH 3T3 non-transformee surexprimant mASAP ; une accumulation de 
25 cellules monopolaires en mitose est observee. 

En outre, en synchronisant les cellules U-2 OS et en recupe- 
rant les extraits cellulaires a differents moments du cycle, il a §te verifie que la 
proteine ASAP etait bien presente dans toutes les phases du cycle cellulaire 
(interphase, S, G2/M). 
30 - co localisation de la proteine ASAP avec I'alpha-tubuline 

La Figure 5 illustre la co-localisation de la proteine ASAP 
humaine avec I'alpha-tubuline ; de meme la proteine ASAP murine co-localise 
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avec I'alpha-tubuline. 

La Figure 5 A illustre la localisation cellulaire de I'alpha- 
tubuline detectee par immunofluorescence a I'aide d'un anticorps anti-tubuline 
(Alexa-594, Molecular Probe). 

5 La Figure 5 B illustre la localisation de la proteine ASAP 

marquee a la YFP (yellow fluorescent protein). 

La Figure 5 C representee la superposition des 2 images 
demontrant la colocalisation des 2 proteines. 

EXEMPLE 5 : Production d'anticorps polyclonaux anti-hASAP et mASAP 

10 a) Production d'anticor ps 

Les constructions suivantes de la proteine ASAP ont ete 
donees dans le vecteur d'expression procaryote pGEX 4T-2 (AMERSHAM) 
„ : comme decrit a I'exemple 4 : 

- proteine ASAP humaine entiere (SEQ ID NO : 1) 

- proteine humaine deletee de sa partie C-terminale contenant 
le domaine MAP potentiel (residus 1 a 421, SEQ ID NO : 47) 

- proteine murine entiere (SEQ ID NO : 46). 

Les proteines ont ete exprimees dans E. coliet purifiees selon 
les protocoles standards. Des lapins ont ensuite ete immunises avec les ' 
20 proteines ASAP purifiees selon un protocole standard, et les serums immuns 
ont ete recoltes. 

b) Analyse de la reactivite des serums nnlvrl o naux vis-a-vis de la protein* 
ASAP endog ftn* 

Les serums polyclonaux monospecifiques diriges contre la 
proteine hASAP entiere ou deletee de sa partie C-terminale contenant le 
domaine MAP potentiel, ont ete testees en Western-blot et en immunofluores- 
cence, sur des cellules HEK-293 et U-2 OS, selon des protocoles standards. 

En Western-blot, le serum polyclonal monospecifique dirige 
contre la proteine hASAP entiere detecte une proteine d'un poids moleculaire 
apparent d'environ 110 kDa correspondant a la proteine ASAP endogene, 
aussi bien dans les cellules HEK-293 que les cellules U-2 OS. Dans ces 
conditions, un anticorps anti-FLAG, detecte une proteine de poids moleculaire 
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equivalent, dans des cellules controle HEK-293 ou U-2 OS, transfectees par 
un vecteur d'expression de la proteine hASAP fusionnee avec une etiquette 
FLAG. 

En immunofluorescence, le serum polyclonal monospecifique 
5 dirige contre la proteine hASAP entiere marque les microtubules des cellules 
HEK-293 en interphase, les asters des cellules en mitose et les microtubules 
du corps residuel en fin de telophase. 

Le serum polyclonal monospecifique dirige contre la proteine 
hASAP deletee de sa partie C-terminale contenant le domaine MAP potentiel 
10 presente le meme profil en immunofluorescence et detecte une proteine 
d'environ 110 kDa, en Western blot. 

Le serum polyclonal monospecifique dirige contre la proteine 
mASAP est utilise pour detecter quels sont les types cellulaires exprimant 
ASAP et a quel(s) stade(s) du cycle cellulaire elle est exprimee, par immuno- 
15 fluorescence sur des coupes testiculaires de souris. 

EXEMPLE 6 : Analyse fonctionnelle de la proteine hASAP a Paide de 
mutants deletes de la partie N-terminale contenant le domaine BRCT ou 
de la region C-terminale contenant le domaine MAP potentiel. 

Des fragments d'ADNc codant pour une proteine hASAP 
20 deletee de la partie N-terminale contenant le domaine BRCT (NdeH : residus 
304 -647 (SEQ ID NO : 48) ; Ndel2 : residus 411-647 (SEQ ID NO : 49) ; 
Ndel3 : residus 478-647 (SEQ ID NO : 50)) ou de la partie C-terminale 
contenant le domaine MAP (Cdell : residus 1 a 477 (SEQ ID NO : 51) ; 
Cdel2 : residus 1 a 418 (SEQ ID NO : 52) ; Cdel3 : residus 1 a 303 (SEQ ID 
25 NO : 53)) ont ete amplifies par PCR a Paide d'amorces appropriees puis 
clones dans les vecteurs depression pEAK10-EGFP (fusion C-terminale 
avec la GFP) et pEYFP-C1 (fusion N-terminale avec la YFP) selon un 
protocole similaire a celui decrit a I'exemple 4. 

Les differentes constructions ont ete transfectees dans les 
30 lignees HEK-293 et U-2 OS puis la localisation cellulaire des differents 
mutants de la proteine hASAP a ete analysee comme decrit a I'exemple 4. 
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On constate que pour les memes deletions, un profil similaire 
est obtenu avec la construction comportant la YFP en N-terminal ou la GFP 
en C-terminal. 

Par comparaison avec la proteine hASAP entiere, les 3 
5 constructions deletees de la partie C-terminale ne colocalisent plus en inter- 
phase avec la tubuline et ne presentent plus un aspect fibreux ; ces resultats 
indiquent que la deletion interesse un domaine MAP. En outre, aucune cellule 
monopolaire bloquee en rnitose n'est observee dans les cellules surexprimant 
les mutants deletes de la partie C-terminale contenant le domaine MAP. 
10 Par comparaison avec la proteine hASAP entiere, les 3 

constructions deletees de la partie N-terminale contenant le domaine BRCT, 
presentent une localisation nucleaire sous forme de foyers mais il reste dans 
V le cytoplasme quelques fibres co-localisant avec la tubuline. 

L'analyse fonctionnelle de la proteine hASAP est completee 
15 v par des experiences deactivation de I'expression du gene par des ARN' 
interferents (ARNi). 
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REVENDICATIONS 

1°) Proteine isolee, denommee ASAP, caracterisee en ce 
qu'elle est selectionnee dans le groupe constitue par : 

a) une proteine repondant a la sequence representee dans 
5 la liste de sequences en annexe sous le numero SEQ ID NO: 1, corres- 
pondent a la proteine ASAP humaine, et 

b) une proteine presentant, sur la totalite de sa sequence, au 
moins 80% d'identite ou au moins 90% de similarite, de preference au moins 
90 % d'identite ou moins 95% de similarite, avec la proteine de sequence 

10 SEQ ID NO: 1. 

2°) Proteine selon la revendication 1, caracterisee en ce qu'elle 
presente la sequence SEQ ID NO: 46 correspondant a la proteine ASAP 
murine. 

3°) Peptide, caracterise en ce qu'il est constitue d'un fragment 
15 d'au moins 10 acides amines consecutifs d'une proteine selon la revendication 
1 ou la revendication 2. 

4°) Peptide selon la revendication 3, caracterise en ce qu'il est 
selectionne parmi les sequences representees dans la liste de sequence en 
annexe sous les numeros SEQ ID NO: 2 a SEQ ID NO: 14 et SEQ ID NO: 47 
20 a 53. 

5°) Proteine variante de la sequence SEQ ID NO: 1 ou de la 
sequence SEQ ID NO: 46, caracterisee en ce qu'elle presente une mutation 
entrainant un dysfonctionnement de la proteine. 

6°) Proteine ou peptide selon Tune quelconque des revendica- 
25 tions 1, 3, 4 ou 5, caracterisee en ce qu'il s'agit d'une proteine ou d'un peptide 
d f origine humaine. 

7°) Polynucleotide isole, repondant a une sequence selection- 
nee dans le groupe constitue par : 

- les sequences codant pour une proteine ou pour un 
30 peptide selon Tune quelconque des revendications 1 a 6 ; 
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les sequences representees sous les numeros SEQ ID 
NO: 15 et SEQ ID NO: 45 dans la liste de sequences en annexe, corres- 
pondant respectivement aux ADNc ASAP humain et murin, 

le fragment d'ADN genomique de 29800 nucleotides 
5 repondant a la sequence representee dans la liste des sequences en annexe 
sous le numero SEQ ID NO: 16, correspondant au gene asap humain ; 

un fragment d'au moins 15 nucleotides consecutifs de 
Tune quelconque des sequences precedentes, a I'exclusion des sequences 
repertoriees sous les numeros d'acces AK024730 et AK024812 et des EST 

10 repertories sous numeros d'acces BU1 98882, BM693711, AW372449, 
BM021380, BU928828, AL707573, AI885274, AI671785, AA805679, 
BU619959, BM021126, AL598336, AW976973, BU629726, AI433877, 
AV751613, BQ372751, AI827535, AI866257, AA843565, R96130, BU684090, 
•BF958121, BQ351941, AW194906, BG203580, BF078132, AW486134, 

15 AL600279, AA025538, AL600264, BF170676, BU759494, BB025236, 
BF214179, AI283076, BE694273, AI266380, BM670854, AA968415, 
BU503982, BB700612, BE988355, BU058357, BB312934, AW061311, 
BM537962, BE988356, BB318982, BB311217, BB557152, BB1 85248, 
BB557128, BB698742, BB1 86736, AV345769, BB274293, BB632007, 

20 BB617958, AI391312, W18534, BB1 86581, BB311289, BB312835, 
AW347411, AA972439, BB263570, AU035125, BB277226, BB274224, 
BB268445, AW024037, AA025609, BB274174, R96089, BB272238, 
BB269037, BB385718, BE007324, BB325992, AJ275277, AI414381, 
BB125476, BB430961, BE232162, BQ121419, BQ121418, BG591509, 

25 BF457670, AL897593, AL897592, BM926692, BM538559, BI759567, 
AL601021, AL598780, AU222540, BG567619, AU 166296, BF889835, 
AU164011, AV656025, BF343454, AW262441, AW237952 dans la base de 
donnees GenBank ; 

un fragment de I'un quelconque des sequences prece- 
30 dentes, selectionne parmi les sequences representees dans la liste des 
sequences en annexe sous les numeros SEQ ID NO: 16 a SEQ ID NO: 30 ; 
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une sequence presentant un pourcentage d'identite d'au 
moins 80 %, de preference 90 %, apres alignement optimal avec Tune des 
sequences ou Tun des fragments precedents ; 

- les sequences complementaires des precedentes, sens ou 

5 anti-sens. 

8°) Polynucleotide ou fragment selon la revendication 7, 
caracterise en ce qu'il s'agit d'un polynucleotide variant de la sequence SEQ 
ID NO: 15 ou 45. 

9°) Polynucleotide ou fragment selon la revendication 8, 

10 caracterise en ce qu'il s'agit d'un polynucleotide porteur d'au moins une muta- 
tion conduisant a une modification de la sequence en acides amines de la 
proteine correspondant a la sequence SEQ ID NO: 1 ou SEQ ID N : 46. 

10°) Utilisation d'un polynucleotide ou d'un fragment selon 
I'une quelconque des revendications 7 a 9 ou de I'une des sequences reperto- 

15 riees sous les numeros d'acces AK024730 et AK024812 et d'un des EST 
repertories sous les numeros d'acces BU198882, BM693711, AW372449, 
BM021380, BU928828, AL707573, AI885274, AI671785, AA805679, 
BU619959, BM021126, AL598336, AW976973, BU629726, AI433877, 
AV751613, BQ372751, AI827535, AI866257, AA843565, R96130, BU684090, 

20 BF958121, BQ351941, AW194906, BG203580, BF078132, AW486134, 
AL600279, AA025538, AL600264, BF1 70676, BU759494, BB025236, 
BF214179, AI283076, BE694273, AI266380, BM670854, AA968415, 
BU503982, BB700612, BE988355, BU058357, BB312934, AW061311, 
BM537962, BE988356, BB318982, BB311217, BB557152, BB185248, 

25 BB557128, BB698742, BB186736, AV345769, BB274293, BB632007, 
BB617958, AI391312, W18534, BB186581, BB311289, BB312835, 
AW347411, AA972439, BB263570, AU035125, BB277226, BB274224, 
BB268445, AW024037, AA025609, BB274174, R96089, BB272238, 
BB269037, BB385718, BE007324, BB325992, AJ275277, AI414381, 

30 BB125476, BB430961, BE232162, BQ121419, BQ121418, BG591509, 
BF457670, AL897593, AL897592, BM926692, BM538559, BI759567, 
AL601021, AL598780, AU222540, BG567619, AU166296, BF889835, 
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AU 164011, AV656025, BF343454, AW262441, AW237952 dans la base de 
donnees GenBank ou de leurs fragments, comme sonde pour detecter, identi- 
fier ou doser des polynucleotides correspondants au polynucleotide selon 
Tune quelconque des revendications 7 a 9, particulierement dans d'autres 
5 organismes. 

11°) Utilisation selon la revendication 10, caracterisee en ce 
que la sonde est selectionnee dans le groupe constitue par les sequences 
SEQ ID NO: 15, 45 ou SEQ ID NO: 17 a SEQ ID NO: 44. 

12°) Amorce pour ramplification des polynucleotides (ARN ou 

10 ADN genomique) correspondants au polynucleotide selon Tune quelconque 
des revendications 7 a 9, particulierement dans d'autres organismes caracte- 
risee en ce quelle est selectionnee dans le groupe constitue par les 
sequences SEQ ID NO: 31 a 43. 

1 3°) Polynucleotide susceptible d'etre obtenu par amplification 

15 a I'aide des amorces selon la revendication 12. 

14°) Methode de determination du profil de transcription du 
gene correspondant au polynucleotide selon Tune quelconque des revendica- 
: tions 7 a 9 ou 13, ou d'une alteration dudit profil, dans un echantillon biolo- 
gique, comprenant une premiere etape d'obtention par tout moyen approprie 

20 des ARN totaux a partir de I'echantillon biologique, une deuxieme etape de 
mise en contact desdits ARN avec une sonde telle que definie aux revendica- 
tions 10 ou 11 prealablement marquee dans des conditions classiques 
d'hybridation entre les ARN et la sonde et une troisieme etape de revelation 
par tout moyen approprie des hybrides formes. 

25 15°) Methode selon la revendication 14, dans laquelle la 

deuxieme etape est une etape de transcription inverse et/ou d'amplification 
des transcrits, realisee a I'aide d'une paire d'amorces selon la revendication 
12 et la troisieme etape est une etape de revelation par tout moyen approprie 
des acides nucleiques amplifies. 

30 16°) Methode selon Tune quelconque des revendications 14 

ou 15, caracterisee en ce qu'elle comporte en outre une etape devaluation du 
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taux de transcription du gene par comparaison a un temoin prealablement 
choisi. 

17°) Methode de mise en evidence dans d'autres especes du 
gene correspondant au polynucleotide selon Tune quelconque des revendica- 
5 tions 7 a 9 ou 13, ou de mise en evidence des variants alleliques dudit gene 
ou de mise en evidence d'une alteration fonctionnelle de ce gene, dans un 
echantillon biologique, comprenant une premiere etape d'obtention par tout 
rnoyen approprie de I'ADN a partir de Pechantillon biologique, une deuxieme 
etape de mise en contact desdits ADN avec une sonde telle que definie aux 
10 revendications 10 ou 11, prealablement marquee, dans des conditions 
classiques d'hybridation entre les ADN et la sonde et une troisieme etape de 
revelation par tout moyen approprie des hybrides formes. 

18°) Methode selon la revendication 17, dans laquelle la 
deuxieme etape est une etape d'amplification realisee a Paide d'amorces 
15 selon la revendications 12 et la troisieme etape une etape de revelation par 
tout moyen approprie des acides nucleiques amplifies formes. 

19°) Methode selon Tune quelconque des revendications 17 
ou 18, caracterisee en ce qu'elle comporte en outre une etape d'isolement et 
de sequengage des acides nucleiques mis en evidence. 
20 20°) Trousse de reactifs pour la mise en oeuvre des methodes 

selon Tune quelconque des revendications 14 a 19 comprenant : 

- au moins une sonde telle que definie aux revendications 
10 ou 1 1 et/ou des amorces selon la revendication 12 ; 

- les reactifs necessaires a la mise en oeuvre d'une reaction 
25 classique d'hybridation entre ladite sonde et/ou lesdites amorces et Pacide 

nucleique de Pechantillon biologique ; 

- les reactifs necessaires a la mise en oeuvre d'une reaction 

d'amplification ; 

- les reactifs necessaires a la detection et/ou le dosage de 
30 Thybride forme entre ladite sonde et Pacide nucleique de Pechantillon 

biologique ou des acides nucleiques amplifies formes. 
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21°) Vecteur de clonage et/ou d'expression dans lequel est 
insere un polynucleotide ou un fragment selon Tune quelconque des revendi- 
cations 7 a 9 ou 13. 

22°) Cellules hotes transformees, dans lesquelles au moins 
5 un polynucleotide ou un fragment selon Tune quelconque des revendications 7 
a 9 ou 13 ou au moins un vecteur selon la revendication 21 a ete introduit. 

23°) Organismes transgeniques non-humains, dont tout ou 
partie des cellules contient au moins un polynucleotide ou d'un fragment selon 
Tune quelconque des revendications 7 a 9 ou 123 ou au moins un vecteur 
10 * selon la revendication 20, sous une forme libre ou integree. 

24°) Organismes transgeniques non-humains selon la reven- 
dication 23 caracterises en ce qu'ils sont porteurs de cellules contenant un 
polynucleotide selon Tune quelconque des revendications 7 a 9 ou 13 non 
fonctionnel ou porteur d'une mutation. 
15 25°) Utilisation d'une cellule transformee selon la revendication 

22 ou d'un organisme transgenique non-humain selon I'une quelconque des 
revendications 23 ou 24, pour la production d'une proteine ou d'un peptide 
selon Tune quelconque des revendications 1 a 6. 

26°) Methode de preparation d'une proteine ou d'un peptide 
20 selon Tune quelconque des revendications 1 a 6, caracterisee en ce que Ton 
cultive des cellules exprimant la proteine ou des cellules transformees selon la 
revendication 22 ou un organisme transgenique selon Tune quelconque des 
revendications 23 ou 24, dans des conditions permettant Texpression de ladite 
proteine, et que Ton purifie ladite proteine. 
25 27°) Proteine, caracterisee en ce qu'elle est susceptible d'etre 

obtenue par la methode de preparation selon la revendication 26. 

28°) Anticorps mono- ou polyclonal caracterise en ce qu'il est 
capable de reconnaTtre specifiquement une proteine ou un peptide selon Tune 
quelconque des revendications 1a 6 ou 27. 
30 29°) Anticorps selon la revendication 28, caracterise en ce 

qu'il reconnait, parmi les MAPs, uniquement et specifiquement la proteine 
ASAP de sequence SEQ ID NO: 1 ou SEQ ID NO: 46. 
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30°) Utilisation d'un anticorps selon Tune quelconque des 
revendications 28 ou 29 pour la detection et/ou la purification d'une proteine 
selon I'une quelconque des revendications 1 a 6 ou 27. 

31°) Methode de detection d'une proteine selon Tune 
5 quelconque des revendications 1 a 6 ou 27, dans les cellules d'un echantillon 
biologique, comprenant 

une premiere etape de traitement convenable des cellules 
par tout moyen approprie permettant de rendre accessible le milieu intracel- 
lular 

10 - une seconde etape de mise en contact dudit milieu intra- 

cellulaire ainsi obtenu avec un anticorps selon Tune quelconque des revendi- 
cations 28 ou 29 et 

une troisieme etape de mise en evidence par tout moyen 
approprie du complexe proteine ASAP-anticorps forme. 

15 32°) Utilisation d'un anticorps selon Tune quelconque des 

revendications 28 ou 29 pour la detection et/ou la selection de cellules 
presentant des perturbations dans 1'organisation du fuseau mitotique et/ou 
une induction des mitoses aberrantes et abortives liees a la surexpression de 
la proteine selon Tune quelconque des revendications 1 a 6 ou 27. 

20 33°) Methode devaluation in vitro de la capacity de prolifera- 

tion ou d'agressivite de cellules cancereuses comprenant 

une premiere etape de traitement convenable des cellules 
par tout moyen approprie permettant de rendre accessible le milieu intra- 
cellular, 

25 - une seconde etape de mise en contact dudit milieu intra- 

cellulaire ainsi obtenu avec un anticorps selon Tune quelconque des revendi- 
cations 28 ou 29, 

une troisieme etape de mise en evidence et de mesure 
par tout moyen approprie du complexe proteine ASAP-anticorps forme et 
30 - une quatrieme etape devaluation du taux de transcription 

du gene par comparaison du taux de complexes proteine ASAP-anticorps 
formes a celui d'un echantillon biologique temoin prealablernent choisi. 
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34°) Trousse permettant de mettre en oeuvre la methode 
selon Tune quelconque des revendications 31 ou 33 comprenant : 

au moins un anticorps monoclonal ou polyclonal selon 
Tune quelconque des revendications 28 ou 29 ; 
5 - les reactifs permettant la detection du complexe proteine 

ASAP-anticorps produit lors de la reaction immunologique. 

35°) Methode de criblage d'une substance capable d'interagir in 
vitro, directement ou indirectement, avec le polynucleotide selon Tune 
quelconque des revendications 7 a 9 ou 13 ou la proteine ou un peptide selon 
10 Tune quelconque des revendications 1 a 6 ou 27, caracterisee en ce que : 

dans une premiere etape on met en contact la substance 
a tester et le polynucleotide ou la proteine et 

dans une deuxieme etape on detecte par tout moyen 
approprie le complexe forme entre ladite substance et le polynucleotide ou la 
15 proteine. 

36°) Methode de criblage d'une substance capable de 
moduler Tactivite de la proteine selon Tune quelconque des revendications 1 a 
6 ou 27, caracterisee en ce que : 

- dans une premiere etape on met en contact des cellules d'un 
20 echantillon biologique exprimant la proteine selon Tune quelconque des 

revendications 1 a 6 ou 27, avec une substance a tester, 

- dans une deuxieme etape on mesure par tout moyen appro- 
prie de I'effet de ladite substance sur Tactivite de ladite proteine, et 

- dans une troisieme etape on selectionne des substances 
25 capables de moduler ladite activite. 

37°) Proteine selon Tune quelconque des revendications 1 a 6 
ou 27 ou polynucleotide ou fragment selon Tune quelconque des revendica- 
tions 7 a 9 ou 13 ou anticorps selon Tune quelconque des revendications 28 
ou 29 ou vecteur selon la revendication 21 ou cellule transformee selon la 
30 revendication 22, utilise comme medicaments. 

38°) Utilisation d'une proteine selon Tune quelconque des 
revendications 1 a 6 ou 27 ou d'un polynucleotide ou d'un fragment selon 
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Tune quelconque des revendications 7 a 9 ou 13 ou d'un anticorps selon Tune 
quelconque des revendications 28 ou 29 ou d'un vecteur selon la revendica- 
tion 21 ou d'une cellule transformee selon la revendication 22, dans la prepa- 
ration d'un medicament anti-mitotique. 
5 39°) Utilisation d'un polynucleotide ou d'un fragment anti-sens 

selon Tune quelconque des revendications 7 a 9 ou 13 ou d'un anticorps selon 
Tune quelconque des revendications 28 ou 29 ou d'un vecteur contenant un 
oligonucleotide anti-sens selon la revendication 21 et capable d'inhiber 
Texpression du polynucleotide selon Tune quelconque des revendications 7 a 
10 9 ou de la proteine selon Tune quelconque des revendications 1, 2 ,5, 6 dans 
la preparation d'un medicament destine au traitement des pathologies liees 
aux perturbations dans ['organisation du fuseau mitotique et/ou a une 
induction des mitoses aberrantes et abortives, liees a la surexpression de la 
proteine selon t'une quelconque des revendications 1 a 6 ou 27. 
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S644PCT88.ST2 5 
SEQUENCE LISTING 



<110> CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE 
GIORGI, Dominique 
SAFFIN, Jean-Michel 
ROUQUIER, Sylvie 

<120> Nouvelle proteine associee aux centrosomes et ses applications 
<130> S644PCT88 
<160> 53 

<170> Patentln version 3.1 

<210> 1 

<211> 647 

<212> PRT 

<213> Homo sapiens 

<400> 1 

Met Ser Asp Glu val Phe Ser Thr Thr Leu Ala Tyr Thr Lys Ser Pro 
1 5 10 15 

Lys Val Thr Lys Arg Thr Thr Phe Gin Asp Glu Leu lie Arg Ala lie 
20 ~ 25 30 

Thr Ala Arg Ser Ala Arg Gin Arg Ser Ser Glu Tyr Ser Asp Asp Phe 
35 40 45 

Asp Ser Asp Glu lie Val Ser Leu Gly Asp Phe Ser Asp Thr Ser Ala 
50 55 60 

Asp Glu Asn Ser val Asn Lys Lys Met Asn Asp Phe His lie ser Asp 

65. 70 75 - 80 - 

Asp Glu Glu Lys Asn Pro Ser Lys Leu Leu Phe Leu Lys Thr Asn Lys 
85 90 95 

Ser Asn Gly Asn lie Thr Lys Asp Glu Pro val Cys Ala lie Lys Asn 
100 105 110 

1 
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Glu Glu Glu Met Ala Pro Asp Gly Cys Glu Asp He val Val Lys Ser 
115 120 125 

Phe Ser Glu ser Gin Asn Lys Asp Glu Glu Phe Glu Lys Asp Lys lie 
130 135 140 

Lys Met Lys Pro Lys Pro Arg lie Leu ser lie Lys Ser Thr Ser Ser 
145 150 ~ 155 160 

Ala Glu Asn Asn Ser Leu Asp Thr Asp Asp His Phe Lys Pro Ser Pro 
165 170 175 

Trp Pro Arg Ser Met Leu Lys Lys Lys Ser His Met Glu Glu Lys Asp 
180 185 190 

Glv Leu Glu Asp Lys Glu Thr Ala Leu Ser Glu Glu Leu Glu Leu His 
195 200 205 

Ser Ala Pro Ser Ser Leu Pro Thr Pro Asn Gly lie Gin Leu Glu Ala 
210 215 220 

Glu Lys Lys Ala Phe Ser Glu Asn Leu Asp Pro Glu Asp Ser Cys Leu 
225 230 235 240 

Thr Ser Leu Ala Ser Ser Ser Leu Lys Gin lie Leu Gly Asp Ser Phe 
245 250 255 

Ser Pro Gly Ser Glu Gly Asn Ala ser Gly Lys Asp Pro Asn Glu Glu 
260 265 270 

lie Thr Glu Asn His Asn Ser Leu Lys Ser Asp Glu Asn Lys Glu Asn 
275 280 285 

Ser Phe Ser Ala Asp His Val Thr Thr Ala val Glu Lys Ser Lys Glu 
290 295 300 

Ser Gin val Thr Ala Asp Asp Leu Glu Glu Glu Lys Ala Lys Ala Glu 
305 310 315 320 

Leu lie Met Asp Asp Asp Arg Thr val Asp Pro Leu Leu Ser Lys Ser 
325 330 335 

Gin Ser lie Leu lie Ser Thr Ser Ala Thr Ala ser ser Lys Lys Thr 
340 345 350 

lie Glu Asp Arg Asn lie Lys Asn Lys Lys Ser Thr Asn Asn Arg Ala 
355 360 365 

Ser ser Ala Ser Ala Arg Leu Met Thr Ser Glu Phe Leu Lys Lys Ser 
370 375 380 

2 
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Ser Ser Lys Arg Arg Thr Pro Ser Thr Thr Thr Ser Ser His Tyr Leu 
385 390 395 400 

Gly Thr Leu Lys Val Leu Asp Gin Lys Pro Ser Gin Lys Gin Ser lie 
405 410 415 

Glu Pro Asp Arg Ala Asp Asn lie Arg Ala Ala val Tyr Gin Glu Trp 
420 425 430 

Leu Glu Lys Lys Asn Val Tyr Leu His Glu Met His Arg lie Lys Arg 
435 440 445 

lie Glu Ser Glu Asn Leu Arg lie Gin Asn Glu Gin Lys Lys Ala Ala 
450 455 460 

Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu Ala Trp Lys Ala Met Lys 
465 470 475 480 

Glu Lys Glu Ala Lys Lys lie Ala Ala Lys Lys Arg Leu Glu Glu Lys 
485 490 495 

Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala Ala Arg Lys Gly Glu Ala 
500 505 510 

Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys Lys Met Glu Tyr Leu Lys 
515 520 525 

Glu Lys Asn Arg Lys Glu Arg Glu Tyr Glu Arg Ala Lys Lys Gin Lys 
530 ~ 535 540 

Glu Glu Glu Thr Val Ala Glu Lys Lys Lys Asp Asn Leu Thr Ala Val 
545 550 555 560 

Glu Lys Trp Asn Glu Lys Lys Glu Ala Phe Phe Lys Gin Lys Lys Lys 
565 570 575 

Glu Lys lie Asn Glu Lys Arg Lys Glu Glu Leu Lys Arg Ala Glu Lys 
580 585 590 

Lys Asp Lys Asp Lys Gin Ala lie Asn Glu Tyr Glu Lys Trp Leu Glu 
595 600 605 

Asn Lys Glu Lys Gin Glu Arg lie Glu Arg Lys Gin Lys Lys Arg His 
610 615 .620 

Ser Phe Leu Glu Ser Glu Ala Leu Pro Pro Trp ser Pro Pro Ser Arg 
625 630 635 640 

Thr val Phe Ala Lys val Phe 
645 
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<210> 2 

<2U> 25 

<212> PRT 

<213> Homo sapiens 

<400> 2 

v<;n Glu val Phe Ser Thr Thr Leu Ala Tyr Thr Lys ser 

10 15 



25 



Met Ser 
1 


Asp 


Glu val 
5 


Lys Val 


Thr 


Lys Arg 


<210> 


3 




<211> 


28 




<212> 


PRT 




<213> 


Homo 


sapi ens 


<400> 


3 




Asp Glu Leu 
1 


lie Arg 
5 


Ser Glu Tyr 


Ser Asp 
20 


<210> 


4 




<211> 


107 




<212> 


PRT 




<213> 


Homo 


sapiens 


<400> 


4 





10 15" 



25 



val ser Leu Gly Asp Phe ser Asp Thr Ser Ala Asp Glu Asn ser val 
1 5 10 15 

Asn Lys Lys Met Asn Asp Phe His lie Ser Asp Asp Glu Glu Lys Asn 
20 25 30 

Pro Ser Lys Leu Leu Phe Leu Lys Thr Asn Lys Ser Asn Gly Asn lie 
35 40 45 



Thr Lys Asp Glu Pro val Cys Ala lie Lys Asn Glu Glu Glu Met Ala 
50 55 60 

• 4 
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pro Asp Gly Cys Glu Asp lie val Val Lys Ser Phe Ser Glu Ser Gin 
65 70 75 80 

Asn Lys Asp Glu Glu Phe Glu Lys Asp Lys lie Lys Met Lys Pro Lys 
85 90 95 

Pro Arg lie Leu Ser lie Lys Ser Thr ser Ser 
100 105 

<210> 5 

<211> 76 

<212> PRT 

<213> Homo sapiens 



<400> 5 

Ala Glu Asn Asn Ser Leu Asp Thr Asp Asp His Phe Lys Pro Ser Pro 
1 5 10 15 

Trp Pro Arg ser Met Leu Lys Lys Lys Ser His Met Glu Glu Lys Asp 
20 25 30 

Gly Leu Glu Asp Lys Glu Thr Ala Leu ser Glu Glu Leu Glu Leu His 
35 40 45 

Ser Ala Pro Ser Ser Leu Pro Thr Pro Asn Gly lie Gin Leu Glu Ala 
50 55 60 

Glu Lys Lys Ala Phe ser Glu Asn Leu Asp Pro Glu 
65 70 75 

<210> 6 

<211> 31 

<212> PRT 

<213> Homo sapiens 



<400> 6 

Asp ser Cys Leu Thr ser Leu Ala ser ser Ser Leu Lys Gin lie Leu 
1 5 - 10 15 

Gly Asp Ser Phe Ser Pro Gly ser Glu Gly Asn Ala Ser Gly Lys 
20 25 30 

<210> 7 
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<211> 83 

<212> PRT 

<213> Homo sapiens 

<400> 7 

Asp Pro Asn Glu Glu lie Thr Glu Asn His Asn Ser Leu Lys Ser Asp 
15 10 15 

Glu Asn Lys Glu Asn Ser Phe Ser Ala Asp His val Thr Thr Ala val 
20 25 30 

Glu Lys Ser Lys Glu ser Gin val Thr Ala Asp Asp Leu Glu Glu Glu 
35 40 45 

Lys Ala Lys Ala Glu Leu lie Met Asp Asp Asp Arg Thr Val Asp Pro 
50 55 60 

Leu Leu ser Lys Ser Gin Ser lie Leu lie Ser Thr . Ser Ala Thr Ala 
65 70 75 80 

Ser ser Lys 

<210> 8 

<211> 24 

<212> PRT 

<213> Homo sapiens 

<400> 8 

Lys Thr lie Glu Asp Arg Asn lie Lys Asn Lys Lys ser Thr Asn Asn 
1 5 10 15 



Arg Ala Ser Ser Ala Ser Ala Arg 
20 



<210> 9 

<211> 54 

<212> PRT 

<213> Homo sapiens 



<400> 9 

Leu Met Thr Ser Glu Phe Leu Lys Lys Ser Ser Ser Lys Arg Arg Thr 
1 5 10 15 

6 
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Pro Ser Thr Thr Thr ser Ser His Tyr Leu Gly Thr Leu Lys val Leu 
20 25 30 

Asp Gin Lys Pro ser Gin Lys Gin Ser lie Glu Pro Asp Arg Ala Asp 
35 40 45 

Asn lie Arg Ala Ala val 
50 

<210> 10 

<211> 32 

<212> PRT 

<213> Homo sapiens 



<400> 10 

Tyr Gin Glu Trp Leu Glu Lys Lys Asn Val Tyr Leu His Glu Met His 
15 10 15 

Arq lie Lys Arg lie Glu Ser Glu Asn Leu Arg lie Gin Asn Glu Gin 
20 25 30 

<210> 11 

<211> 54 

<212> PRT 

<213> Homo sapiens 



<400> 11 

Lys Lys Ala Ala Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu Ala Trp 
15 10 15 

Lys Ala Met Lys Glu Lys Glu Ala Lys Lys lie Ala Ala Lys Lys Arg 
20 25 30 

Leu Glu Glu Lys Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala Ala Arg 
35 40 45 

Lys Gly Glu Ala Leu Gin 
50 

<210> 12 
<211> 49 
<212> PRT 
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<213> Homo sapiens 



<400> 12 

Ala Phe Glu Lys Trp Lys Glu Lys Lys Met Glu Tyr Leu Lys Glu Lys 
1 5 10 15 

Asn Arg Lys Glu Arg Glu Tyr Glu Arg Ala Lys Lys Gin Lys Glu Glu 
20 25 30 

Glu Thr Val Ala Glu Lys Lys Lys Asp Asn Leu Thr Ala Val Glu Lys 
35 40 45 

Trp 



<210> 13 

<211> 43 

<212> PRT 

<213> Homo sapiens 

<400> 13 

Asn Glu Lys Lys Glu Ala Phe Phe Lys Gin Lys Lys Lys Glu Lys lie 
1 5 10 15 

Asn Glu Lys Arg Lys Glu Glu Leu Lys Arg Ala Glu Lys Lys Asp Lys 
20 25 30 

Asp Lys Gin Ala He Asn Glu Tyr Glu Lys Trp 
35 40 

<210> 14 

<211> 41 

<212> PRT 

<213> Homo sapiens 

<400> 14 

Leu Glu Asn Lys Glu Lys Gin Glu Arg lie Glu Arg Lys Gin Lys Lys 
1 5 10 15 

Arg His Ser Phe Leu Glu Ser Glu Ala Leu Pro Pro Trp Ser Pro Pro 
20 25 30 

Ser Arg Thr val Phe Ala Lys val Phe 
35 40 



WO 2004/058815 PCT/FR2003/003895 

S644PCT88.ST2 5 

<210> 15 

<211> 2575 

<212> DNA 

<213> Homo sapiens 



<400> 15 
acttccttcg 


tctgggtggt 


tgccccagcg 


acacgttggg 


ccgaagagcg 


gtgttgggta 


60 


cccgagagac 


ccggcggtgg 


ggaagtcact 


tcctcccgaa 


gacgctgttt 


cctagcaacc 


120 


gccctccgcc 


tctgttatta 


gcccctcctc 


ctcgctcggt 


ccaggaccgg 


ctctgcgggc 


180 


gccgccaggc 


ccagaccaag 


ctactatcag 


aagttgaatt 


ctaataatta 


gctatrttat 


240 


aaaggtaacg 


agaaaaaata 


cactatgtct 


gatgaagttt 


ttagcaccac 


tttggcatat 


300 


acaaagagtc 


caaaagttac 


caaaagaact 


actttccagg 


atgagctaat 


aagagcaatt 


360 


acagctcgct 


cagccagaca 


aaggagttct 


gaatactcag 


atgactttga 


cagtgatgag 


420 


attgtttctt 


taggtgattt 


ttctgacact 


tcagcagatg 


aaaattcagt 


taataaaaaa 


480 


atgaatgact 


ttcatatatc 


agatgatgaa 


gaaaagaatc 


cttcaaaact 


attgtttttg 


540 


aaaaccaata 


aatcaaacgg 


taacataacc 


aaagatgagc 


cagtgtgtgc 


catcaaaaat 


600 


gaagaggaaa 


tggcacctga 


tgggtgtgaa 


gacattgttg 


taaaatcttt 


ctctgaatct 


660 


caaaataagg 


atgaggaatt 


tgaaaaagac 


aaaataaaaa 


tgaaacctaa- acccagaatt 


720 


ctttcaatta 


aaagcacatc 


ttcagcagaa 


aacaacagcc 


ttgacacaga 


tgatcacttt 


780 


aaaccatcac 


cttggccaag 


gagtatgtta 


aaaaagaaaa 


gtcacatgga 


ggagaaggat 


O ,1 A 

840 


ggactagaag 


ataaagaaac 


tgccctcagt 


gaagaattgg 


agttacattc 


tgcaccttct 


r\ r\ r\ 

900 


"tcccttccaa 


cgccgaatgg 


catacaafta 


gaagctgaga 


aaaaagcatt 


ctctgaaaac 


ybo 


cttgatcctg 


a g gat tea tig 


cttaacaagt 


ctagcatxat: 


catcacttaa 


acaaattctt 




ggagattctt 


tttcaccagg 


atctgaggga 


aacgeatctg 


gaaaagatcc 


aaatgaagaa 


1080 


atcactgaaa 


accataattc 


cttgaaatca 


gatgaaaata 


aagagaattc 


attttcagca 


1140 


gaccatgtga 


etactgeagt 


tgagaaatcc 


aaggaaagtc 


aagtgactgc 


tgatgacctt 


1200 


gaagaagaaa 


aggcaaaagc 


ggaactgatt 


atggatgatg. 


acagaacagt 


tgatccacta 


1260 


ctatctaaat 


ctcagagtat 


cttaatatct 


accagtgcaa 


cagcatcttc 


aaagaaaaca 


1320 


attgaagata 


gaaatataaa 


gaataaaaag 


tcaacaaata 


atagagcatc 


cagtgeatet 


1380 


gccagattaa 


tgacctctga 


gtttttgaag 


aaatctagtt 


ctaaaaggag 


aactocatcg 


1440 


acaactacct 


cttctcacta 


tttagggact 


ttaaaagtct 


tggaccaaaa 


accttcacag 


1500 


aaacagagca 


tagaacctga 


tagagcagat 


aacataaggg 


cagctgttta 


tcaggagtgg 


1560 


ttagaaaaga 


aaaatgtata 


tttacatgaa 


atgcacagaa 


taaaaagaat 


tgaaagtgaa 


1620 


aacttaagga 


tccaaaatga 


acagaaaaaa 


getgetaaaa 


gagaagaagc 


attagcatca 


1680 
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tttgaggcct ggaaggctat gaaagaaaag gaagcaaaga aaatagctgc caaaaagagg 1740 

cttgaagaaa aaaacaagaa gaaaactgaa gaagaaaatg ctgcaagaaa aggagaagca 1800 

ctacaagctt ttgaaaaatg gaaagagaaa aagatggaat atcttaaaga gaaaaataga 1860 

aaggagagag aatatgaaag agcaaagaaa cagaaagagg aggaaactgt tgccgagaaa 1920 

aagaaagata atttaactgc tgttgagaaa tggaatgaaa aaaaggaagc ttttttcaag 1980 

caaaagaaaa aagaaaaaat aaatgagaaa agaaaggaag aactgaaaag agctgagaaa 2040 

aaagataaag ataaacaagc tattaatgaa tatgaaaaat ggctggaaaa taaggaaaaa 2100 

caagaaagaa ttgaacgaaa acagaagaaa cgtcattcct ttcttgaaag tgaggcactt 2160 

cctccgtgga gccctccaag cagaactgtg ttcgcaaaag tgttttgata attctagttc 2220 

ttacattatt tggttattta tcggtttgcc aatattagcc atagatttaa accattcaat 2280 

tatttatagt tagaggaata tattttaatt aaatgccaga cactcctgct gacaatgaaa 2340 

gaaatacttt ggaatgtaat cagtgaaagc atttttttga actgtagata aactgcctca 2400 

aacaaagacc taataatcag attgttttta ccattaagat acataagatt ttatcatgtc 2460 

ctgataattc ttatggtgga gtgattcatg atctttttca ttaagctctg tatgttattt 2520 

aagtatattt aattccagta ataaaaagga aatcatctag gtaccataaa aaaaa 2 575 

<210> 16 

<211> 29750 

<212> DNA 

<213> Homo sapiens 

tctgggtggg agttgggcgg gtcctgtctc ctaggcaaca gcacatgcac acaagcgacc 60 

aataatgagc ccctctccaa agacccagga aggtgatgtc acttccttcg tctgggtggt 120 

tgccccagcg acacgttggg ccgaagagcg gtgttgggta cccgagagac ccggcggtgg 180 

ggaagtcact tcctcccgaa gacgctgttt cctagcaacc gccctccgcc tctgttatta 240 

gcccctcctc ctcgctcggt ccaggaccgg ctctgcgggc gccgccaggc ccagaccaag 300 

gtgagcagct cctacccgat gcttggctct tgattctcag ggtcgcggag aactggccgc 360 

gggcgtccgg ggccgggaac agaaagcggg acctgggggc catzgggggat ccggacagag 420 

accgcgcttg gacgtgcacg ggcctggcgt tcgctggtgc tcagcatacg gcgcggtgag 480 

gagcggcgag cacccggacg tcacctggcc tggtagggaa cggaacccgg ggcgcacaac 540 

gctatgggcg gccctgccag gcctctgctc cgagtacggg aaaccgcgat tttaatgcgg 600 

ctcatcgcga aagcrtcgtc gttttgtctg gctctcttta acacttttgt gagaggaaaa 660 

attggcttgc aatacatctc gctggctgtt tgcgggttag cattacgatc tttttctttg 720 

aatagcgctg tatgcaaata tatagataca tttttttttt ggtggtggtg ctcataattt 780 

10 
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960 
1020 
1080 
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ttacgccgac gatccttttg atggcctttt aaataagacg tgacttattt tgaaggcaat 

gttatacttt agaagagagg tgaaaaataa ggtgttctat tttaattggc agcattttgt 

cgtattaact tgtaatcatt tatttgcaga ctttttaagt agttgcaaaa ctattttagg 

ataacttcca tttgaatttt tttaaacaag cttgttatga gaatttgcta tttctttaca 

agaacctttt taagtgaaga tgtagcccaa tgttcatatc agatgctttt ctttgacctt 

tgtggggaga gtagaatcaa atgtaataaa ataaattctg aagcatgcga agtctgattt 1140 

gttttgtata tttcagctac tatcagaagt tgaattctaa taattagcta ttttataaag 1200 

gtaacgagaa aaaatacact atgtctgatg aagtttttag caccactttg gcatatacaa 1260 

agagtccaaa agttaccaaa agaactactt tccaggtaaa gtatttttat ttggaatcat 1320 

ttcacagtgt aaacactgta ttagatgggt tgaaattggt gattctagaa cagtcctata 1380 

taaagcaggg gtaaatctta tattactttt gaggttttgc acatgatcat gtttgggctc 1440 

catccagtat tacaaactcc cctatatggt tttaagacta ccaaagtagc ctcaatacta 1500 

gtttcctact aagttaaaag ttgaatcgca accttaaatt gccattttta tataaaaact 1560 

tttttttctg ttgtaacata atgtttaagt ttttttttct gttgagtcac tgcaattttg 1620 

aactcagcct ctaagtttgc aatattgatt gcatccattt ctgaaatatg ccgagacaaa 1680 

agctcttaaa aataccaatt tctttcaaaa taccagtttt taataaatta taatctaaat 1740 

tgagcccctt cttarttgtt accctccagc tctaattata acctgcaatt aatttgttcc 1800 

ataatgtgtg tctcctctag ttaaactgcg agctccatga ggaagggctc ttgtctgtga 1860 

tgctctgcat tgagtatgag gcgtaaagtg ggtacatggc ataaagtgag cttgcaggaa 1920 

atatttgtta gatgaatgaa acctaagttt gaaagcagtc gttaatcaag cattgtttgt 1980 

ttaaagaatt acttgtgaat atgatacctc catgtttgga tggaaattga tttcagtatc 2040 

tcatttcagg atgagctaat aagagcaatt acagctcgct cagccagaca aaggagttct 2100 

gaatactcag atgactttga cagtgatgag attggtatgt gacagtatgg aaacgtgaac 2160 

cacttttctt ctttttgctt ccttagtttt gtatttagcc agccccccaa ccacccatcc 2220 

cctcaatcac gtatgttaaa ataataccta agcattcact aattttagat tttcaacttt 2280 

ttaattagta gaaagccact cttaattttc aggaagttgt atgattttct ttttttattg 2340 

ttgttttgtt ttctgaatgt gtatacgaaa atataaatta attgatggca ggtttgcagt 2400 

aaaaggatgg ctgccagtgg taaaccacat tgaagaagac aggttcatct ttaagatcaa 2460 

ccctaggagg tgctacagct agttagtaac tagtcccaca gaactaaact tcggtgcaca 2520 

ttagaagtgc ttttataaag cttgctataa atcagatttt ttttggctgt gataaggggt 2580 

aaatttaaaa accacagact cttcgtgttt catatatcag tactattata atttggtttc 

tcttagctat gtaaacatat taacatttta gtttcaggta taagcataca gaattctaaa 

cttggtgttt ttgtttgttt gtttttgttt ttgagatgga gtctcgctca gttgctcaag 2760 

ctggagtgca gtggtgcaat ctcggctcac tgcaacctcc acctcccagg ttcaagtgat 2820 
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tctcctcctt 


cagcctcctg 


agtagctggg 


actacaggtg 


cccgccacca 


tgcccggcta 


2880 


atttttgtat 


ttttagtaga 


gatggggttt 


caccacatcg 


gecaggctgg 


tctcgaactc 


2940 


ctgaccttgt 


gatccgcccg 


cctcagcctc 


ccaaagtgct 


gggattatag 


gtgtgagcca 


3000 


ccgcacccgg 


cctggtgttt 


tattctttaa 


aatttggtga 


ataattgtaa 


ttgatttctg 


3060 


taaaaccagt 


aataaccaca 


gttaaatcac tgctgtatag 


ttaacttagc 


atttcttatg 


5120 


attcttagta 


aatctaatat 


tctggtgtgg 


atggaattgt 


agttccaaaa 


tttttatgga 


3180 


aaaaatataa 


ttagtaatta 


ctaattaaat 


tcttccaxtt 


acaaatgttc 


ttgattttac 


3240 


atgaagaagt 


aatttgcaaa 


taaaagtttt 


acagtccata 


atctaattta 


aatgetacat 


3300 


gactgattgt 


tagggacctt 


tggatggctt 


tttccagagc 


aaacagtgtt 


tggttgtttg 


3360 


gtaccctaca 


gacaacacaa 


taaatacatt 


ttgaataaat 


taatgaaatt 


ggaattttta 


3420 


tttcataaat 


gttaatgaga 


cgtgcctgag 


ttagctgtgt 


ttttagagct 


gcaagtctat 


3480 


ttataaaata 


catttgtgcc 


tattcattgt 


tagaattttg 


tttgtagctt 


ttaaggtaaa 


3540 


ctttgattaa 


gttaacgtaa 


ccttgacaat 


ttttaaaaat 


actgttgaaa 


acatttttct 


3600 


tttccatttt 


tcagtttctt 


taggtgattt 


ttctgacact 


tcagcagatg 


aaaattcagt 


3660 


taataaaaaa 


atgaatgact 


ttcatatatc 


agatgatgaa 


gaaaagaatc 


cttcaaaact 


3720 


attgtttttg 


aaaaccaata 


aatcaaacgg 


taacataacc 


aaagatgagc 


cagtgtgtgc 


3780 


catcaaaaat 


gaagaggaaa 


tggcacctga 


tgggtgtgaa 


gacattgttg 


taaaatcttt 


3840 


ctctgaatct 


caaaataagg 


atgaggaatt 


tgaaaaagac 


aaaataaaaa 


tgaaacctaa 


3900 


acccagaatt 


ctttcaatta 


aaagcacatc 


ttcaggtaat 


ttgttaggat 


tactgtaatt 


3960 


gcatttcttg 


gaagtttatt 


ttaagataan 


cagtcccaaa 


atttttatat 


ggtagctagt 


4020 


atatatittaa 


gaaaaaaaga 


cagacttaac 


titccatttta 


cagacctgtt 


gtattttgtc 


4080 


taacttcaat 


tttacagacc 


tgttgtattt: 


■tgnctaactt 


caattttaca 


gacctgttgt 


4140 


attttgtctt 


gcatctaggc 


"tgttgcctga 


tagaaagcca 


aagcacaaag 


ccaaagcacc 


4200 


tttagtcatc 


catagcatcc 


atagctgtgg 


axe tccagac 


acctagacct 


gtgagcttca 


4260 


gttttgtttg 


taggtgtgga 


actggaatgg 


aatgctgtct: 


aatccctctc 


acactccaaa 


4320 


gattagagtt 


acagcaatat 


tgagactaat 


ccttctaaca 


gtctttgeca 


taccaacatt 


a ~> o r\ 

4380 


gtgccagaaa attttcttga 


catttgtata 


tttgaaggat 


gagttatgtt 


attgetgetg 


A A A f\ 

4440 


ttgtttgttg 


aagcatccag 


gcactcctta 


agagaatctc 


catttgatct 


ctgtattgcc 


4500 


tatgaaaatc tactaagatt 


cagttttcca 


aaggaaagtt 


cctggtgtga 


tctgggatta 


4560 


cagttagttc 


tgcccacaat 


tttactgaat 


-tttaagcata 


aaggaacaaa 


gatagaatga 


4620 


aacggagacc 


aagtcctgtc 


acataccctg 


ggccaccatt 


catgaacttg 


tatatgeaag 


4680 


gttaaggatt 


ttttgttttt 


cattctttgt 


attttataaa 


ggaattatta 


gttgatgtta 


4740 


accttcataa 


aaatctcctt 


gcatatcatc 


agtaaataca 


gtgctggtaa 


atatttcata 


4800 


ctttgcatat tagataccag 


tggtaacgtc 


agacaaaact 


ttatttcagg 


catgtattgg 


4860 
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ggaactgctc 


ctttcttcct 


gaccccacaa 


tctcattaac 


tttgaaatga 


gcaaaggatg 


4920 


taagcagagc 


aaagaacact 


agaataatat 


ccaggacact 


gggggaaagg 


cctctgtata 


4980 


ttatatatga 


cttcagcaaa 


taagttaagc 


ttcagtatcc 


tcatgatgag 


gaagctaaaa 


5040 


ataaccctct 


ttctattcct 


gcaaaattgt 


gagagtttat 


tgaagtgcat 


ctcataaact 


5100 


ataaaaaact 


acaaaaatgc 


aaacagatgc 


ataatgaaac 


aattaacttg 


ttaaaatgta 


5160 


ccttctaagt 


atagtgagtg 


aaatcaatgc 


tggagagaag 


aggaacataa 


ttgaacttcg 


5220 


ttattaagaa 


aatgcgagca 


tatatagcaa 


ctaaaaattt 


gtctgagaca 


ggtggatgta 


5280 


tataattaga 


agtttatggt 


agataatcag 


gaaagcaata 


atccacctat 


ttcatacctt 


5340 


aaaaaaaaaa 


aaaacctgtg 


gtgggttaca 


atgaataaga 


aaatactgta 


ttttaaccac 


5400 


aaggtggcat 


caggatccta 


aatgctctac 


ttatatatgc 


aatgttatat 


tcagtacgtg 


5460 


taatataaaa 


ataattacct 


aaataggtaa 


ttgtatacat 


tgattaccaa 


aaaaagcgct 


5520 


tttcttaaag 


tataggcatt 


tttttttctt 


tttgggaact 


tgacagtact 


tctggaagtg 


5580 


gaatttttgt 


agaaaatata 


ttaaagttgt 


cattctcagg 


ttcttcaggt 


tgaaaagtaa 


5640 


aaattgaggc 


tagtgttcct 


aagataatat 


ctggcatata 


taataagtat 


ttaaatgaat 


5700 


aaattaatat 


atgaatgatt 


tatctttgaa 


agagggaata 


tggttcatga 


gtttatcctc 


5760 


taaattcttt 


gacttttttt 


ttttctgtac 


aggtttggaa 


ctcaatgttt 


ttaatgtggt 


5820 


gagatattgc 


tgagtagcaa 


gtaatgcttt 


atgaaactat 


tagagcttga aggttttctc 


5880 


tgtccttgct 


tgtcttttgt 


aaaaagtata 


ataaccagac 


tttatagtca 


ctactgaagt 


5940 


gacagttgct 


ctataaagtg 


aaagtattrt 


tcacaggata 


tgtttttatt 


ttaatactaa 


6000 


catgactgaa 


atcatgaact 


ttggagtcag 


gatgcttctc 


ctttaatctg 


agatctgcag 


6060 


cctgctagag 


tttgtgactt 


tgggcatgag 


acctctttgt 


tctcatttta 


ttcatcttta 


6120 


aaaacgggat 


aatagttgcc 


tgcctctagg 


agtttgaggc 


aattaaatga 


gttcacatat 


6180 


ttgaagtgct 


tagaatagta 


ctggcataaa 


tttagcactc tataaatgtt 


ctgattattc 


6240 


attttattat 


ttagcgtttg 


tttataaaca 


tgctcagcag 


gtataaagta tcagtcatgc 


6300 


gggatgcgta 


agttctagag 


atctgctgta 


cattgtgcct 


atagttaaca 


gtactgtctt 


6360 


ttgcactgaa 


tgtattaaga 


aggtagatct 


catgtttgtt 


cttaccacaa 


taataaaaaa 


6420 


aattgactca 


acaccttctt 


tcaggcatta 


tataatattc tgcttaaact 


gaggctcaaa 


6480 


agacatgcaa 


gcatttgtca 


ggaggagaag 


caggaagtgg 


atattctagg 


cagggggatc 


6540 


agcttaggta 


aaggtatggt 


agcaggaggg 


attggaggga 


ttgtggtatg 


tgtgcatgac 


6600 


aactgttagc 


ccagcatttc 


agaaacacag 


atgacaaaat 


ggctgtagat 


aaggcagtga 


- 6660 


aggacaaaac 


cataaaatcc 


gttttatgtt 


gtttaaaggc 


agttaagctt 


ttattctgta 


6720 


ggattggatc 


atggggagcc 


attgaataat 


tttgtagaaa 


ggagtgatgt 


gatctgattt 


6780 


ggattttgta 


aatatcatgg 


aagcagtgat 


ctaggaaaga 


gtggataagg 


acccgacagc 


6840 


agggatgtag 


aaagtggaat 


aaatgagata 


tttggcaatt 


agaattgata ggatatattg 


6900 
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atactctgga tttaggggat aatagaggga ggaatctaga gcccttggat ttggggttga 

acatttggct ggagtttagg atgtagctaa aattgtcagc tacttataat aataccaatt 

tggtatggtt gtggaatctt ctggcagaat ccataagccc atttttaggt aaatgggagg 

aagatgttaa ttagaccaat tttgaagttg agaaaaatgc atttgtagaa caatagaaac 

ataaatatgt atagcaggta aaatgcaggc aaaaaatata tacatggaaa gtcttcccat 

tgtttcgaat actggatgca aatcagcatt tgattcttga tttaaactta gaagtaatgg 

aaagagtgaa attttaataa atgctaaaga agttttatgg actcagaaca attaactcat 

aaaagattcc ttcctctaat gagagttagc actcctatcc cttgagtgcc aacatcatca 

tctttgtcct tataatagca cttataatct tagtaatcta gtcttgtaat tttgtttaga 

aaaatcaacc tgtaaagtac ctggacaggt ccattgccgc tttgttgatt atgaggttta 

gtaacgtgta cagggcttgg tactcaaagg cttgatggat gagcctcctc attttatagt 

ggtagaaact ggggcaagat tttgttttgt ttttttattt ttaacatttt ttttttaata 

ttataagagt tcacaatgtt gaagagttaa cttcttgtga ctggttactt tcaggatgac 

aactgtttct ttactttgtt ttttttttgt tgttgttgtt gtttggtttt tttttttttt 

ttagatggat ttttgctctt attacccagg ctggagtgca gtggtgtgat ctcgatctcg 

gctcactgca acctcagact cctgggttca agcaatcctc ctgcctcagt ctcctgagta 

gctgggatta caggcacgcg ctactaagcc cggctaattt ttttgtattt ttagtagaga 

cagggtttca ccgtgttagc caggctggtc tcgaactcct gacctcatga tctgcccacc 

tcggcctccc aacgtgctgg gattacaggc gtgagtcacc gctcccaaca tgtcgggatc 

acaggcgtga gccaccgcgt ccggcctgat tattaaccat catttatttg tgccttacta 

gagctctgta tagagaagag ttgtgggctt catctggact cttcaggaca gagaacaaag 

gggcataggc acaggaggga agtatggtag cacccagaga gatagataaa gccatggtca 

tttttttata cacacacttt aagcatttta tttttcagca gaaaacaaca gccttgacac 

agatgatcac tttaaaccat cacctcggcc aaggagtatg ttgaaaaaga aaagtcacat 

ggaggagaag gatggactag aagataaaga aactgccctc agtgaagaat tggagttaca 

ttctgcacct tcttcccttc caacgccgaa tggcatacaa ttagaagctg agaaaaaagc 

attctctgaa aaccttgatc ctgaggttag cactaccact aaactgttga attgtgttct 

tgaatttatg cttntttatc tgattatgaa aaagagaagg agagaatgaa tttgtgtgcg 

tgtgtgtgtg ttttacatac tttcttctgc aactgataag gaaataattt ttaaaaatac 

actgtattcc accgagtcta aaactgcatc aattgtaaga cgtagcatta. ttttacatac 

cactaaggaa gaaggaaatg catccaatta aactataaca caccagtgat tgtagagttt 

atccagtttt agagaaagta aaatgtcaaa aagtgttgct tttctgaatc tatataatag 

tgtttatctt taataatttt ttaaatttat gtatctttga attatgtaat ttatggctaa 

gaacaatata gtcagtgtca ttttatttat ttgattttat tcactcaaca aatgtgtgtt 
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gaatgttcat 


ggcactcttc 


tgtgttcttt 


gggttatgtt 


ccaatagcat 


taaatgtggc 


9000 


ctttcaggtt 


tccatcaggg 


aatttactat 


gcattgttat 


taagggagaa 


cacttcgttt 


9060 


ttctctttgt 


atttcactat 


gagaagcaaa 


ctgtcccttc 


tgaacatttc 


agaagggaaa 


9120 


agtacaggaa 


gaacatttct 


tccccataat 


ctgcttgggc 


agattaggga 


actgcatgcc 


9180 


acctggccaa 


gcttctttct 


ttttctcatc 


gcttgtctgc 


agtgttggtg 


cttaaggatc 


9240 


tgctctctgg 


gaggtgaggc 


agaaggtgct 


gagaggagct 


cttttgtgca 


atgactaaat 


9300 


gggggaatcc 


ccctaattca 


gactggaagt 


attaggaagc 


acaataggct 


accaattcaa 


9360 


atcttgttct 


gcagttgagc 


tttaccagta 


aagctgacaa 


tttgatatac 


gcctaactga 


9420 


caccaccatg 


ctgtttctta 


atttgttctg 


aaaaccagaa 


gaagaaaccc 


aagcaaatac 


9480 


tttatattta 


agaaaattat 


ctgatccatt 


gaatattgtg 


ctagtttctt 


gtagctgctg 


9540 


taacaaattg 


ccacaaactg 


gttaacttaa 


aacaacagaa 


atgtattctc 


ttagttctgg 


9600 


aggtcagaag 


tccaagatca 


aggtgtttgc 


agggccattt 


tcctctgaag 


gcatcacgga 


9660 


agaatccttc 


cttgcctctt 


ccagcttctt 


tctagtggtt 


gccagcagtc 


catggcattc 


9720 


cttggcttgt 


agctggcttg tagctgcatc 


attcccttct 


ctgccttcat 


cccatgtggc 


9780 


cttcttccct 


gtgttttctc tgcatgtctg 


tgtctcttct 


ttctcttaaa 


aaaagacacc 


9840 


aggcattgga 


tttagggccc 


accctaattg 


agtgtgtcct 


catcttatct 


atttaaagct 


9900 


gtaaacacct 


tatttcctaa 


gaaagtcgta 


ttttgaggtt 


ctggatgaac 


atgaattttg 


9960 


gggcattaat 


gttcgtatgt 


taaacctagc 


attcccggga 


taaactctgg 


ttagtcatgg 


10020 


tgtgatattt 


tattgtggga tgtgatttgt 


taaaattgtg 


ttaaggtttg 


catctatatt 


10080 


tatgaagtct 


attggtctgt 


aatttttttc 


ttataatgtt 


accatcaggc 


ttgggtatca 


10140 


aatgagttgg 


ggagtgtctt 


ttcttcattt 


tataaaagtt 


tggtatcatt 


attttcttaa 


10200 


atgagaggat 


tcaccagtac 


aattatctgg 


gcctggaatt 


ttctgtgtgg 


agacatcttt 


10260 


ggcattacat 


ttgatttttt 


aaataggtat 


ttcagtactc 


acattttctg 


ttttgccagt 


10320 


ttggtaattg 


tgtctatcaa 


gaagtttgtc 


catttcatct 


gatatgttga 


gtttataaac 


10380 


agagttgttc 


acgatagtcc 


ctcattcttt 


tgatgactag 


gattatcatg 


acatttcatt 


10440 


tttatttcta 


acatatataa 


tttgtgtttt 


gtgtctttcg 


tgctaaatct tgataggcat 


10500 


tgcttagttt 


tattaaacgt 


ttttaagaac 


cacttcggct 


ttgtcatatg 


ttggtgcaaa 


10560 


agtaattgca 


gttttggcca 


ttactttcaa 


tgacaaaaac 


cgcaatcatt 


ttgcaccaac 


10620 


ctaataattt 


tctctattgt 


ttgtttaatt 


gattttcagt 


attatttcag 


tattattcag 


10680 


tattatttct 


tttactttct 


tttttttttt 


ttgagacaga 


gtctcgttct 


atcgcccagg 


10740 


ctggagtgca 


gtggtgcaat 


cccagctcac 


tgcaagctct 


gcctcccagg 


ttcactccat 


10800 


tctcctgctt 


cagcctcccg 


agtagctggg 


actacaggca 


cccaccacca 


tgcctggcta 


10860 


atttttgtat 


ttttagtaga 


gacggggttt 


caccgcgtta 


gccaggatgg 


tctcgatctc 


10920 


ctgacatcgt 


gatccaccca cctcggcctc 


ccaaggtgtt 


gggattacag 


gcgtgagcca 


10980 
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cggcgcctgg cctcttttac tttcttttgg tttaatttgc ttatctttag atttgaaaat 11040 

tttctcattc atrtttaaga ttttcgtgat ttctgctaaa cctgttgaaa ggtgtaaact 11100 

ttcrtctttg tactgctrta gtggccccga ttttttgatg ccttttattt ttattatcat 11160 

ttctttaaat atatatttta acttcccttg tgatctcctg ttttaaaaat ttattttttt 11220 

agttgaaaaa taataattgt acatggggta catagtgatt tttcgataca tataatatat 11280 

agtgatcatt gtgatctctt ttttgaccag ttggttattt tatggtgatt tattttattt 11340 

tcaaatactt gttttttctc tagatatact tttgatgtta attataagtt aattttgttg 11400 

tagtctagag aatgtatctt acatgatttc aaatttttaa aaattattat tattatttct 11460 

aaatggccca gctttagtgt atcttgtgaa agtctcattt gcatctgcaa agtagatgtg 11520 

ttctccaggt gttgaatata atgttgtata atttaagttt ggtcaacatg gttggtaata 11580 

tcattcagat cttctttatc cttactgatt tttcatccaa tttgtttacc cgttaccaac 11640 

ttaggggtat taaaatatcc agttatgttt gtgggtttgt ttatacttct ctttagttct 11700 

gtcagtattt tataactttg ttatcaggca catacacatt tattattatt atgttttgag 11760 

cattatgaaa cgtctctacc tctggtaata ttcctttcct tatcttatag attgttttgt 11820 

gtaatacttc agctttctta tgacaagtgt ttccatggta tatgctttct atrcttttttc 11880 

tttcaaacta attctgtctt ttcatgtaag tgaatctctt acaataagag tttggtgtca 11940 

cttttttatt aagtctgaca atctatgcct tttaatgtag tgtttagtcc atttatgaat 12000 

gttttgtcca tttaatgtaa atactgctat gattggattt aggagcaart tgttgctctt 12060 

tattttctat ttatctgttt tttaaaatta ttgtttttat tgttgtttct ctgttactcc 12120 

tttcttgcct ttttttgagg agataatcat gaatctttta gttttttatt attattgacc 12180 

ttttatctat atttgtttgc attgtatttc tcagagttga tcagtggatu acagaatata 12240 

tctgaaaatt atcacaatct atttagaatt gatattgtat tgtttcacat ttgatctaga 12300 

aaccttggaa taatatagtt ccatatactc cctcatccat tgtgctattg tcatatatta 12360 

tatctacata tcctataatc cccacaatag agttataact ttttcttaaa gagccctttc 12420 

agttttttgt attagacttt taaaaaatta aagaaggcta gaataaatat atattatata 12480 

xctactgtat tatatattgt atatattata gataacattc tattgctaaa tatagataat 12540 

atatatttgt agacaatatc tatatatagg taatatatat tctattctta tatattatat 12600 

agatatataa catctatata atctatttat agatattaca tatctataaa tacatataca 12660 

atttctaggg atcttcattt cttcctgtag attcagatta ccattttgtg tcctgtcagt 12720 

cttacaaact tattttacat ttcttgtaat acaggtttac tagtgatgga tttttctcag 12780 

tctttgcttt tctaaaagta tttgtctcat ctttgttttc aaatggtggt tgatgtgatt 12840 

gtattcttct tgtctaacag ttgccttctt ctacctccag ctctttatag gtttccattt 12900 

ttattggcct ctcttgtaat cattcatttc attgtcctct ctatataatg tgttgatttt 12960 

gtctgaatgc tgtcaggaat tttactcaag attgtggttt ttatcttttg attacagcaa 13020 
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tttgactgca 


tggtgcctgg 


gtctagcttt 


ctttatgttt 


attctgcttg 


acgtttgttg 


13080 


agctttccaa 


acctataagc 


tgatactgtc 


tgtgaaatgg 


gaagattgtt 


atttcccacc 


13140 


ctatttttca 


tcctctcctt 


ttggtactgt 


agttacacat 


gcattgaaat 


ttgtgctata 


13200 


tctcactgat 


ctctgagatt 


ctgtttatat 


ttcttaaatc 


ttttttcctc 


tttgttttta 


13260 


agattgaata 


acttgtatta 


cttagtcttc 


acgtttacag 


attgtggtcc 


ggagaatgta 


13320 


tcttttatga 


tttcaaattg 


tattaaatta 


ttttgttttg 


ttttaatggc 


ccagcaaaag 


13380 


ggtatgtcgt 


gagagttcca 


tttgcagttg 


caaagtatgt 


gtgttttcca 


ggtgaatttt 


13440 


ttatttcact 


tattgtggtg 


ttcaacttca 


gattttctat 


tggtattttt 


tctgtttttt 


13500 


aatataaaat 


cccccatctt 


ttcagccatc 


atgcatatat 


tttccccaaa 


gtgcttgaac 


13560 


atatttatat 


tagctatttt 


aaagtccttg 


tctgctaact 


ctaaaacgtg 


agtcatctct 


13620 


gggttggtrtc 


ctattgacca 


ttctctgttt 


ttttattttg 


ttttttaaat 


aagtgtcacc 


13680 


attttctgtt 


tctttagtga 


cttttgattg 


aataccgggt 


gttctgaatg 


atattttgta 


13740 


gagattctgt 


attcttttat 


gtcccttcaa 


acatattttc 


tagcaagtgg 


atatcatggc 


13800 


tggacacaaa 


ttcccaatcc tgtttctcct 


gcagtggata tcagctgaaa 


tttctgctta 


13860 


attcttttca 


gtttctagct 


tctatgcttt 


tacaggatcc 


tctgaggtct 


cccttatgcc 


13920 


acaaatagag 


gtggtaaagg 


tttttggtga 


atttcatatg 


cagattttgt 


ggtcactgtc 


13980 


ctctgctatt 


ttccacatac 


ttattggctg 


atctgatggt 


cctagactca 


gtcccctgtt 


14040 


ccctcaagtc 


attccaccaa 


ggctgtagcc 


ttctattact 


tgagctgcat 


agactggaga 


14100 


atgccttctg 


gcaaaaagct 


actaatttgc 


agatctcctc 


aggtgaagct 


ttatctttca 


14160 


gggtagactc 


cagtgtctca 


gcacttcttc 


cattttctca 


aatgttttct 


ctccattgct 


14220 


tttgacatat 


aatttccttt 


gcacccataa 


aatactgcgg 


agaaagaaaa 


ttaaagtatt 


14280 


tgtacaacaa 


agttgaactt 


cctacattgt 


aatatcatta 


cctttaggct 


agatgattct 


14340 


atgaagaaat 


gtttacctta 


gatagacaaa 


tataattatt 


tcatatcaga 


tagaattttc 


14400 


agaattttga 


ggaaaactca 


agtgcatgca 


atctatgtgc 


ttttcctatc 


taaaatattt 


14460 


ggaagtagcg 


gcttacttga 


ttttattaaa 


tgctttcatt tggataacta 


gtaatatttg 


14520 


cttggaacta 


aagtatttta 


cctgtcttct 


ttatgctttc 


cttcaaagga 


taattgtagg 


14580 


aagagctatc 


aaaatcaaat 


cttggcctta 


aatatttata 


agaaatgtga 


ttattaagta 


14640 


ataggagttt 


tgaaaattgg 


taaaaaataa 


atagagaggt 


ggtggtagtt 


aaagaacttg 


14700 


aataactctt 


tcagtgaccc 


cttttaatga 


ccaagacatc 


aaggcttgaa 


agtaaagcat 


14760 


gcttacctcc 


attggcttgt 


cacactttgc 


gtttcagcaa 


eaaatgccta 


aataatgcag - 


14820 


anttcagagt 


tatgcactat 


ttcaatttgt 


agttttaata 


atgctattgt 


tcccataaat 


14880 


gttaattatt 


aaacttatgt 


ggcaaatgta 


tttttttttg 


cgaaaacagg 


attcatgctt 


14940 


aacaagtcta 


gcatcatcat 


cacttaaaca 


aattcttgga 


gattcttttt 


caccaggatc 


15000 


tgagggaaac gcatctggaa aaggtggtta 


tatctaataa 


ttatatctta 


tatgtgaact 


15060 
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ctgtactact tagactcctg tttgtaagag aaataatact ttgtatagtt ataagagaaa 15120 

tatatgtttt tatgtgtttg agttttaatc ctgactatgt agttaactaa ctgtgatttt 15180 

ggatgcagaa cttaatctct cagtgcctca atttccctaa gttatattat ttgtctcata 15240 

aggttattgt gaaaattaag tgatatagtg cattttagcc attagcctag rtaatagccc 15300 

aagtggagtg agcacttaag gtaaactact gttatgtatg tgttgctgtg atattctgca 15360 

ggacaacata atagctaggt ggaattttaa agtgagacta agctagattc caatacaggc 15420 

acaattacat aagcaaagta actaaccttt ctgaccctgt atgttgatct ttaaaatggg 15480 

taaaataaga gtaatttgcc ttatagggtg ttgtaagaat taaacatgta aagcatttac 15540 

agcaatacca tagtaagcac ttggtgtgat atgtgaattg ttaacataat ttcttttctt 15600 

agtgatacgt agcttaatga aacctaaaag acatagctat ttctaggtct gagatgtgta 15660 

atgaacattt tagtgcttac tatgtagtat catttttgtc attttacaga tgagaaaagc 15720 

tgaagtgcag tgacttaggg aaacataccc aaggtcagtg atggaaccat agttaaatct 15780 

tgagttccaa agttcttgtt cttttcactg aacagattaa cagctccaaa gaatccaata 15840 

gtgaattgag tgattttaag cccatgttac ctcaaaacaa attccaaaaa aatggtcata 15900 

atgaaaccaa cagaattaag acttttcaca gtaaagattc aggtttagct gcaaggtgga 15960 

cgttggtaga actgaaagtt ggtgatccca ttccaaaatg tggtaaaatc agaatagtag 16020 

aagcaattct ataaatgcaa aactgaatct tcttatgcca gagcttgagc ctgtttcttg 16080 

gagcactgag aggataagca ataggcttgt ctttattgcc ccttatggta tcagaggaag 16140 

tactacatct tggtgagatg aaactcacta gagactgtgt aaaattgcat taattcttgg 16200 

ttctttctgc agctatacaa ttcaacaatt gtactactag taactgtagt agcctagaga 16260 

ggtgtgacac cttcttatgc agcgtgttgt tccagctaag aaactcaggc tttagagtta 16320 

aacaaatatt gtcatctcac ttacttggtt tgtatatcaa caagctcttt tgacatgtcg 16380 

ttgttttagg gtagttattc cattctgttt attaatatgc tatttttcta agtactagat 16440 

ttgttaagtg cttcattagt taagcctaga ctattttttt ttgtaaatca ctttcgaaaa 16500 

gagtttatgc aagtttaata tgataacttt tcttcatatt ttgcaagaaa aaagagntta 16560 

tagatagtcc tcatttaaaa gaaagcaaat gaatcaagta tttaccttat taattcagaa 16620 

gggggtttta atgctattac tctgtctcaa aatagatcca aatgaagaaa tcactgaaaa 16680 

ccataattcc ttgaaatcag atgaaaataa agagaattca ttttcagcag accatgtgac 16740 

tactgcagtt gagaaatcca aggaaagtca agtgactgct gatgaccttg aagaagaaaa 16800 

ggcaaaagcg gaactgatta tggatgatga cagaacagtt gatccactac tatctaaatc 16860 

tcagagtatc ttaatatcta ccagtgcaac agcatcttca aaggtatttg taaaaattca 16920 

tacttttcat actacagctt aaaacttgaa atagaacttt aagaaatttt atcttctgtg 16980 

ttatatactt ctgaattacc agtggaaaat rtatcttttg atagtgatat tgtattgtca 17040 

catggttctt acttaatcca ataaaattta actttaagga aagtttgtag tgaatataat 17100 
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gaaacccagt 


gtttaaaaat 


tatcagaggt 


gtgtgatcat 


aatatacttt 


taaatgtctc 


17160 


agaaatgcat 


actcatagtg 


tatatatttc 


cataggtctt 


catattttaa 


aaatataact 


17220 


gtctggaata 


atttctgaga 


ttttaaatta 


gagttatgtt 


tttggatatt 


gttttaaaac 


17280 


gtgttaacaa 


ttttaacaaa 


aatcttaaag 


aaatgtttat 


caacagttta 


tcaacatctg 


17340 


tgcttcttta 


aaatagatgg 


ttatcatcag 


gaacattagt 


attattattc 


gtatttgatc 


17400 


ctttgccttt 


atttcctaat 


tttcaaaata 


atgaactggt 


gccctggcaa 


cctccagagg 


17460 


tgatgaagtt 


gctttgtttt 


ttcttttttc 


aattcatgta 


aatttaatgg 


ttacaagtgc 


17520 


ttttttgtta 


catggatata 


ttgtgtagtg 


gtaaagtcag 


acttttagta 


taaactaaaa 


17580 


tgtacattgt 


acccattaag 


taatttctca 


tcccgcacct 


ccctctcacc 


tttcctagtc 


17640 


tccattatct 


attattccat 


accctatata 


catgtgtaca 


cattatttag 


ctctgacttg 


17700 


taagtgagaa 


catgtaccat 


ttgactttct 


gtttctgatt 


tatttcactt 


aaggtaatag 


17760 


cctccagttc 


catccatgtt 


gtaaaagata 


ttatttcttt 


tctgtgtggc 


tgaatagtat 


17820 


tcctgtgtgt 


gtgtgtgtgt 


gtgtgtgtgt 


gtgtgtgtgt 


atacacattt 


tctttataca 


17880 


atcatatgtt 


gatgtacact 


taggttgatt 


ccatatcttt 


gctattgtga 


ctagtggtgt 


17940 


gataaacatg 


agtgcaggta 


tcttttttat 


ataatgattt 


attttccttt 


tggcagatac 


18000 


tcacagtggg 


gttgctggat 


tgagtggtag 


ttctatattt 


agttccttaa 


gaaatcccca 


18060 


aactattttc 


cataaagatt 


gtactaattt 


acattcttac 


caagagtata 


caagcattcc 


18120 


cttttctctg 


tgttctcacc 


aacatctgtt 


acttttttaa 


ctttttaata 


atagctaaat 


18180 


attctgacta 


gtataatata 


tctcactgtg 


gttttaattt 


gtgtttctct 


gatgattagt 


18240 


gatggtgaac 


attttttttc 


atgtttcttg 


gccacttgta 


tgtcttcttt 


tcaaaaagtc 


18300 


tattcatgtt 


ttttgccctc 


tttttagtgg 


ggttatttgt 


tttttgttgt 


tgttgttgag 


18360 


gggaacatta 


ttattataac 


cttaagaaac 


agatatgtaa 


tatgtaggat 


tacttgtccc 


18420 


tacattaaat 


tgtgcctgag 


tgctatactt 


taaaaattta 


tggtgtagca 


ttttcagtct 


18480 


ttgtttctcc 


tgaatttgtc 


attatctctt 


gtagctgcaa 


ttagctagca 


gctctgtgtg 


18540 


tttattatca 


gcggaagaaa 


acagggctag 


ctgaaaattt 


gtgtttgagc 


aatactttta 


18600 


taacataaaa 


tacaagcttt 


tcttaaaatt 


gatgaaggag 


gttcattaag 


ccatgttcca 


18660 


ggtatatcat 


ccttagctaa 


tttctttagg 


aaaaaaacac 


tactgctaag 


ttagggatgt 


18720 


gtttattatg 


tctgtgctct 


cactttacca 


ctagcaccca 


tcagtctgtg 


taaagtagaa 


18780 


aagttgttcc 


ttaaaagaag 


aaaggatatt 


ccggagttta 


tagacaggat 


tgtagaatgt 


18840 


ctaatagagg 


caattctaaa 


ttagaacagg 


catttcatat 


gtaacaagta 


aggttgtaac 


18900 


ttgtttcttt 


tgactggacc 


cttggcctca 


ttcttactct 


ctactgaatg 


accttttcta 


18960 


aacagaaata 


taatcattct 


ccattaaagt 


ctttttgttg 


gtttctcatc 


acaagaattc 


19020 


catccagact 


cctcatcgct 


gcctagtgat 


ctcacctggt 


tcttccctga 


ccacgtcttc 


19080 


ctccgctttc 


cctgccattc 


actatgcttc 


agctccattc 


acctctttct 


gtttttcaga 


19140 
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gataacaggt 


tccgtccctt 


ctcaggcttt 


tacccacttg 


ctgtttcttt 


ctttcataga 


19200 


cctttcggtg 


ggccctttgc 


actcttagct 


ctgatgtcag 


cccctcagga 


cagccttccc 


19260 


tgaccaactt 


ctttaaagca 


gctcctcagc 


cccactctag 


tcattctctg 


tcactgcaca 


19320 


ctatttnatg 


tccttcatga 


gccatgtttg 


cttatatatt 


tarttttggt 


catccgtctc 


19380 


tagaatttaa 


tattcttaag 


ggcattttat 


tcactgattt 


gctcccaatt 


tctactgtgt 


19440 


ttgacacata 


gtagatgctt 


aaagaatagt 


gatttactgg 


cagtttggct 


tctaagccta 


19500 


aaaaggatag 


ttgtcatgaa 


taaatcatct 


ttggcatttt 


ctgtttaata 


gaaaacaatt 


19560 


gaagatagaa 


atataaagaa 


taaaaagtca 


acaaataata 


gagcatccag 


tgcatctgcc 


19620 


aggtaataaa 


gttaccaata 


tttgtcattt 


atgggcttgc 


attctagcaa 


agctagtttt 


19680 


aatttaactt 


tcataaagta 


aatttcattt 


ggtgttactg 


tattttcttt 


ttatttccat 


19740 


ttcataaaat 


gaaagtagtt 


aacttcatga 


naaaacccct 


tggttgatga 


tattatttga 


19800 


aataaagtaa 


tttataaaaa 


gtaagtctat 


tactgattgt 


tttagtgcct 


ggaatgttta 


19860 


tgcaatacct 


ttgctctcca 


ggatcgtcct 


aggaatattt 


ttcttctttc 


ttaatgtcag 


19920 


tgattaggga ttctttgtgc 


tccagactgc 


ttctggaata 


gagcttcttt 


ctcctacttt 


19980 


tcctgagaca 


agcaatataa 


aatggtaata 


aagctgaagt 


ctagcaatga 


tacttattca 


20040 


ttatcaagta 


tcattgtcta 


acatgagaaa 


ttgtactgaa 


agccttcaga 


atctatgaac 


20100 


taagtaggtt 


tattaaaatg 


attatctgta 


tagcttcatt 


cacaccaatg 


ataatgaatg 


20160 


cctaactcat 


aagtgctaat 


caaaaacctt 


ctgaatcttt 


aaaattatcg 


ttagtcaaat 


20220 


tatcattaat 


caaataaaac 


agagctagca 


agctttttct 


gtaaatggcc 


agttagtgca 


20280 


tattrtaggc 


tttgtaggcg 


atacagtctg 


tattggaact 


actcatttct 


gctattttaa 


20340 


caggaaagca 


gccacaggca 


aaacttaaca tgaatgatta 


cagctatggt 


gcaataaact 


20400 


ttgtatatca aaaccaatgg 


ctggccaaat 


tttcccacca 


atccctgata 


tagatagtac 


20460 


tattctttct 


aattttatat 


ttggaatgct 


tcatgtaaca 


aaatgatgaa 


agaaaatatt 


20520 


aaaagagtga 


ttataaccta 


ctgtattgtt 


ttttccatgt 


aacttgagaa 


gtggtccata 


20580 


tttcttaagt 


ttctiaattac 


aaatatttaa 


aaagagcaat 


cattttaaag 


ctatataact 


20640 


taaagttata 


aaatttaaan 


tatgttgaag 


gggacatatt 


taagttatgt 


ccccttctac 


20700 


ataatttaat 


attctttgta 


tactaagact 


gtacatttta 


cctacatcat 


tttcaaagta 


20760 


attataattt 


gttaaattat 


aatgtagttt 


ccaatttttt 


ttttgagatg 


gagtctcact 


20820 


ctgttgctca ggctggagtt 


cagtggcatg 


atctctgctc 


actgcaacct 


ctgcctcctg 


20880 


ggctcaagct 


atcctcccac 


ctcagcctcc 


agggtagcta 


tgactacagg 


catgtgccac 


-20940 


cacgccagct 


aattttttgt 


atttttggta 


gagacagggt 


ttcaccatgt 


tgcccaggct 


21000 


ggtcaacagc 


ccaacaggat 


gagctcaagt 


catccaccca 


ctttggcctt 


ccaaagtgct 


21060 


gggattacag 


i gtgtgagcca 


tcatgcctgg 


ccagttttca 


aatattatac 


gtgcatattc 


21120 
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tttcagatta 


atgacctctg 


agtttttgaa 


gaaatctagt 


tctaaaagga 


gaactccatc 


21240 


gacaactacc 


tcttctcact 


atttagggac 


tttaaaagtc 


ttggaccaaa 


aaccttcaca 


21300 


gaaacagagc 


atagaacctg 


atagagcaga 


taacataagg 


gcagctgttt 


atcaggtaaa 


21360 


aaaggaaaat 


atttttaaga 


gaagaagaat 


gatcactttc 


ataagcctac 


actgtttata 


21420 


aagaataaag 


taatcctgat 


agaaaatgat 


ggtttaatac 


ttaaatttat 


tgagaaagag 


21480 


tttcctttta 


atacatgagt 


aatcatattt 


tactaaatta 


tttgcttcca 


cactttgcat 


21540 


aactgaccat 


agttgttttt 


aaagaaagaa 


tatgccattg 


caatttatag 


aaatacagca 


21600 


caagccaaaa 


cattgtaaag 


tctatatatg 


ttttcatttt 


tttcttcttg 


aagtttatat 


21660 


gaacaaaagg 


agttattatg 


aacaaaaagt 


tattaaattt 


tttctttcct 


gagatgttgt 


21720 


taggcgtaca 


taggaaaaag 


attgtattaa 


tttattcaca 


attctaaaag 


tctttrtttg 


21780 


tcttttttag 


agtagaatag 


tatactttag 


aaaattgtac 


atgtgaattt 


cagagaaaat 


21840 


gttaatataa 


agaattctaa 


ttcacttaag 


aaattttaaa 


tattatatga 


cctttttctt 


21900 


gttct*tatag 


gagtggttag 


aaaagaaaaa 


tgtgtattta 


catgaaatgc 


acagaataaa 


21960 


aagaattgaa 


agtgaaaact 


taaggatcca 


aaatgaacag 


gtattctgac 


atatagaagt 


22020 


aaaaatgttt 


tggattttta 


tttcagtaaa 


atatccctga 


atatataact 


tttctaaatc 


22080 


agctttttaa 


atggcaaaat 


aacttgtata 


ttaaagaaat 


gatttccggt 


tttacttctg 


22140 


ttttacttta 


tacattttag 


tttgatataa 


ctgttttaca 


tgaaaacaga 


ttttaatttt 


22200 


gtatatgtat 


aggatagctt 


tgttcctgct 


gattatgaag 


ttattattgt 


ttatgagcac 


22260 


ctaattcact 


tttaaaagtt 


gatttcattt 


agaacttaac 


caagaaggcc 


aggtactgtg 


22320 


gctcatgcct 


gtaatcccag 


cactttggga 


ggccaaggca 


gatgggattc 


cttgaggtct 


22380 


ggagttcgac 


accagcctgg 


gcaatgtggt 


gaaaccccat 


ctctactaaa 


aatacaaaaa 


22440 


ttagccaggg 


atggtggtgg 


gcacctgtaa tcccagctac 


tcaggaggct 


gaggtggcag 


22500 


gatcacttga 


acccgggagg 


cggaggttgc 


agttagctga 


gatcgtgcca 


ctgtactcca 


22560 


gcctaggtga 


cagagactct 


gtctcaaaaa 


aaaaaaaaaa 


ggcacgacaa 


gataaaggat 


22620 


cattagacac 


tagttagcct 


tcaattttcc 


tcttttctct 


cttgaatttt 


ataagtatct 


22680 


tcaagtccaa 


cccctacctg 


aactcttgat 


ctgtatcctt 


tcccattgaa 


tggaggtgaa 


22740 


cttttgttcc 


tgtctcttct 


gtactgagtc 


tcttcctcta 


actcctgctt 


gtaatacgct 


22800 


cagttatttc 


ttatcttcta 


aagtcaaact 


tctggacaaa 


aactccagtg 


tgctgttcaa 


22860 


tactaaaaat 


agatttagaa 


gaaaaatatt 


ttccaaggtg 


aactgcacga 


taatgcgtca 


22920 


gtagtgaagg 


gagcagccct 


ccagggggcg. tgcctgtcta- 


tctgttaacc 


acgt.tcatag . 


22980 


cagtatgctg 


ctgtggtcag 


tgccataccc 


cttctcattt 


gattttcgta 


gctctgtgag 


23040 


gtagatagta 


ctttgacctc 


taaattatgt 


taccccaata 


ttaaggtttt 


atgtcattta 


23100 


atattgaaca 


ataaagcaaa 


catagaatat 


tatgggatta 


gattgaagga 


agtaaaataa 


23160 


taacataact 


tgctatacag 


tctccaacct 


atttttcagt 


cgagcacata 


ctttcaacat 


23220 
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ttggaataca 


tttgtgcagt 


aagaacttta 


tgttttgata 


ctattcaaaa 


ttaagattta 


23280 


aaccaaaaat 


ctgcatctta 


ctgcatggct 


tggccaattt 


gccttactct 


aacttacttt 


23340 


ataagcccat 


aactttactg 


attttttttt 


caaatatttt 


attatgaaaa 


ttttactata 


23400 


ccacttagcc 


tattacagtt 


tattttgata 


taatttgttt 


agtacacttt 


caaaaataat 


23460 


agttgacatc 


tttctcatta 


ataggtcaat 


atgtgataaa 


tgtttttaga 


aaaggacgtt 


23520 


ttaaaaccaa 


tgaataattc 


agataacatt 


ctttgtaaat 


tatctaagcc 


attctaaata 


23580 


aattacctac 


tttgaaagtt 


aatttctaag 


tataatgaat 


atcagaggac 


taaagataaa 


23640 


tgtatatgtg 


tatatttata 


tctagccata 


tttgtgtcta 


tgtatatata 


catatatatg 


23700 


tatatcactc 


tattattttt 


tccactgtag 


aaaaaagctg 


ctaaaagaga 


agaagcatta 


23760 


gcatcatttg 


aggcctggaa 


ggctatgaaa 


gaaaaggaag 


caaagaaaat 


agctgccaaa 


23820 


aagaggcttg 


aagaaaaaaa 


caagaagaaa 


actgaagaag 


aaaatgctgc 


aagaaaagga 


23880 


gaagcactac 


aagtattcag 


aactttgcac 


atcttaatta 


ttttaaaaca 


tttgaaatcc 


23940 


aaattaatga 


ttaaccatat 


ttttatttat 


tttcaaatat 


tcacagtaag 


aaaattattc 


24000 


tgaacttttt 


caggcttttg 


aaaaatggaa 


agagaaaaag 


atggaatatc 


ttaaagagaa 


24060 


aaatagaaag 


gagagagaat 


atgaaagagc 


aaagaaacag 


aaagaggagg 


aaactgttgc 


24120 


cgagaaaaag 


aaagataatt 


taactgctgt 


tgagaaatgg 


taatccaaaa 


tcataaatat 


24180 


tttgatatat 


tttaaattat 


agtaacactt 


caggatttta 


taaaatttat 


ttacttgaaa 


24240 


tttagtaatg 


catttcaatt 


tcattactgt 


caaagatgta 


ctagggaatc 


tttattatgt 


24300 


attttccttt 


aactctccag 


tgrtttatac 


tatgctctat 


aggaatgaaa 


aaaaggaagc 


24360 


rtttttcaag 


caaaaggaaa 


aagaaaaaat 


aaatgagaaa 


agaaaggaag 


aactgaaaag 


24420 


agctgagaaa 


aaagataaag 


ataaacaagc 


tattaatgaa 


tatgaaaaat 


ggctggtagg 


24480 


tattatttgt 


caatgcactt 


tcgtcrtttt 


catgtacctt 


ttgtgtcttt 


tctgtcccta 


24540 


attctaattc 


tatttgctcc 


agacctactg 


atcatttcta 


cctggaatct 


gctttgttga 


24600 


attcaagctc 


tcctcctgca 


tatagcatat 


tttctttgac 


ttagtcattt 


ctattaatgt 


24660 


ttctactatt 


ccctcaaaca 


cccaggctga 


aaacttgtta 


taatcttctt 


ccttacctgc 


24720 


atccccacat 


ttaccattta 


ctattcatgc 


ccattcttcc 


tttgctgtga 


ttctcacatc 


24780 


taacatagaa 


agaagacaag 


tttactattg 


agggtactac 


gtggtggaac 


ttggtcatga 


24840 


caaaaagtaa 


cactgaactt 


aatagtgaga 


aaattattcc 


atcttttatt 


ctcttttgat 


24900 


gtttctgatg 


acctcaagga 


gaatctctta 


tttaggaatt 


tttaatgaaa gagagcaggt 


24960 


ttgaggttta 


ggaggagcaa 


tagctagctg 


aaccagatat 


gtgtatatan ttgatttcac 


. 25020 


tttacttatc 


tttataaaag 


ttactttttg 


ttgatgtcaa 


gcaaaatatt 


attttccatt 


25080 


ttagaatatc 


aatataaata 


tgcattttgt 


ccatgtttat 


ataagtaata 


cattactatg 


25140 


aataaatact 


ttacataagt 


aggtaacaca 


ttcatatgaa 


tagttaacat 


attcatatga 


25200 


ttcagcaacc 


aaaattatag 


tatttttgca 


ctagaagtct 


atccagtcag 


gtttcctatc 


25260 
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aaactttaaa 


acaactcata 


ccaatcaact 


aaatcatcca 


ggttgttttt 


gatttgcatt 


25320 


tctctggtta 


gaattgagct 


tgaatatctt 


ttcatttgta 


tacaggccat 


ttatctatta 


25380 


ttttctctgt 


aaattgtcat 


ttcatagact 


ttgcacactt 


ttctattaga 


ttgttggttt 


25440 


tttttcctta 


ctggtttcta 


gaatcttttg 


ttttgtactg 


gggaaattag 


cctatcattt 


25500 


tttatatggg 


ttgcaaatat 


ttacccccac 


tatattgttg 


gtttcccggc 


tttccttata 


25560 


gtatctcatg 


ccatgaagaa 


tttaaatttt 


aggtgtcaga 


tttctgtttt 


ttttttttgg 


25620 


cttttgattt 


tcaagcatag 


ttgaaaagac 


ctacacaatt 


tgagattaaa 


cagaattatc 


25680 


ttatttttct 


tctaacaact 


ttgtgacttt 


aatatcttaa 


tgttttaaca 


tttgttctgc 


25740 


ttggaatttg 


ccctgataca 


tggtgggaaa 


tatgatttca 


actttagttt 


ttccaaatgt 


2 5800 


atcctttata 


aagtagccca 


tttttaccca 


ttgatttgag 


gtgctacttc 


tgttatatga 


25860 


taccttctca 


tgttttcggg 


tctgtttctt 


aactttctgt 


tccattggtc 


agtctcgtga 


25920 


ttccagtgcc 


acacttccat 


tattaggctt 


gatatgtcta 


aatatctgct 


tggattcatc 


25980 


tccctttata 


gttcttcttt 


cacagtcttt 


ctgaccagtc 


ttgtttattt 


attttttcca 


26040 


taaacttaag 


aatcagcagt 


agttagaaag 


gtacatggga 


ccaaaatgag 


cgatttaaag 


26100 


ataggataaa 


aagataaaac 


aataataaac 


ttaagaaaca 


tgccagacca 


acataaagaa 


26160 


aattgtagaa 


cuctcctgaa 


caacacaaat 


gaagacttga 


gaaaatggat 


cagaattgcc 


26220 


catgcacaga 


aacacactta 


accttataat 


gatgttataa 


ggatgtcagc 


tctccctgaa 


26280 


gtcatttaat 


gcaatcttaa 


caaaagccaa 


caggatttac 


tctgtgtgtt 


gagtttagta 


26340 


ctgctatatg 


ctaattcgat 


gcagagaaat 


agtaataaaa 


taaggtaatc 


aaaattggtt 


26400 


caattttgaa 


tgaaaaaggt 


agtgtttcat 


gatgatttcc 


ttaagttaat 


ctgttaaata 


26460 


atgctatgtt 


ctaaaaaaaa 


atttaaagtc 


cacttatatt 


aagaagatgt 


acactgactg 


26520 


ctagtatcaa 


ttagggaaat 


taaatgtaaa 


catttgagtt 


ttccatttta 


attccatatc 


26580 


ttcatgaaaa 


tggaatagaa 


tttctttaat 


aagtcacatt 


taggtatact 


gtttttaatt 


26640 


atagcactta 


attacattgt 


cattcttatc 


agtcctctga 


agaacaagaa 


ttcctcaaag 


26700 


accaaagaca 


aaataacatg 


tttgatatct 


agtaaaatgt 


ctgcaaatat 


agtacaccta 


26760 


taaacacata 


aacatacatg 


ttacagatcg 


gttctccttc 


ttaccaaatt 


cttattgaaa 


26820 


tttgtttgca 


gatagaatag 


aaaaattgcc 


cctgtatagg 


agtctaatga 


cttcagtttt 


26880 


catggaaaac 


aacatctcaa 


gctttttata 


tacaaactag 


tttgaacagt 


aagcatttgg 


26940 


tgggtaattg 


ctttagggga 


aagttaatag 


ccaaagatca 


ggtaagacta 


aaatattttt 


27000 


cttgccaatt 


accagattaa 


ttcatcatta 


cctttagtaa 


gaaaataagc 


aaaaagctca 


27060 


gttttccaca 


aataaatgtc 


tgaaggactt 


tttaacaagg 


ttcttttaat 


tactatcaag 


27120 


gtgactattg 


artcttttga 


actgatatta 


cagttaatat 


aattgtctat 


ttgctaccct 


27180 


ggctttacag 


ctccctgcta 


gtaagatgaa 


gcatatttca 


agttactgcc 


ccctcatgtt 


27240 


aagtgaaatt 


acaaaaagag 


atttattcag 


tcaatttctg 


tggacacagt 


ctggtcactg 


27300 
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cttttcttcc 


gcctagctag 


atggtctgtc 


tctaaaatat 


taaaatgatt 


gaagatgatc 


27360 


taattacagc 


tttgcttttc 


tcaattaaaa 


ttctgaaagg 


aagtttcctc 


tttgccttat 


27420 


tagaaatagc 


aagcaaacaa 


acatgcaagc 


attcttatga 


catggaatga 


ggatatgggt 


27480 


gttaacattg 


acaaaaaaca 


aacaaacctc 


ccacttcact 


ttgtttgtta 


catgtgaatg 


27540 


gaaagcttgt 


cctgtattgc 


catattattc ttgtggcatt 


tatatatata 


ctgatgaaaa 


27600 


gatgcataca 


tacctaatca 


ttttccataa tgcctttcct 


cccaagccat 


caacctgcag 


27660 


aggcaggutt 


cactaagggt 


tttcctgctc 


cttgaggaat 


atgagaaaaa 


taccaagatg 


27720 


aagaaaccac 


caaaccttat 


agtgttagca 


gagacataaa 


gggacacctg 


gtgcccctct 


27780 


tccatttctt 


gtctcctgcc 


ttctgccaag 


ccttagtcac 


aatggatatt 


tttgtttcct 


27840 


cccacagcac 


acattttttt 


tcccactctc 


agagccctca 


ccactactgt 


ttgcaagcaa 


27900 


agctcttccc 


cgatatttat 


cacgagtggc 


ttctcttatc 


catcatgtca 


cacttcaaag 


27960 


ggactttccc 


tgagtccatt 


ttttgttgaa 


agtaaatact 


ctttrttatt 


ccttctcata 


28020 


gttttaaaac 


atgtttcaga 


gaaattcaca 


caatttggaa 


ttatctgttg 


tttattttct 


28080 


ttgtttctgt 


ccattttgaa 


agttccctgg 


gggacaggga 


ccatatctgt 


gtgttgggat 


28140 


tttaaaaaat 


tatttttatt 


tgcaaatgac 


acataaaaag 


tgcacatatt 


tatggaatac 


28200 


agtgtgatgt 


ttccatctac 


attgtataca 


ttgtgtaaca 


atcagaaatg 


actcacaaag 


28260 


gtaggcaaaa 


tgtttgatgc 


aaagatatca 


ttaatattta 


ttataggaaa 


gtacacaaat 


28320 


tactaaaaat 


taaaggcaaa 


taccatacat 


ttaaatgggc 


caaataattg 


agcagaaaat 


28380 


ttacaaaagg 


ctaaagaaat 


gtttgaaaat 


gtgctcaagt 


tcaataataa 


agaaacatga 


28440 


ggcagaattt 


ttaactattt 


gtaaaaaatt 


tgaagtatct 


catactgtca 


tgacatattg 


28500 


aaactntgca 


cccagtaaac 


ttacttctga 


gaatttgttc 


tcacgaagtc 


accaccaact 


28560 


tataacagtt 


actatatttg 


agttataatt 


ataggtcttt 


ttttctattt 


tatacaattc 


28620 


ttttttaatg 


ttttcacttt 


taaagtttaa 


aaaattaagt 


gatattagta 


cttgcaaatt 


28680 


gacaatgttt 


actaattttt 


ttcttgtttc 


cattttttgt 


ttgtttgttt 


ttttgagaca 


28740 


gggtctcact 


ctgttgccca 


ggctggagtg 


cagtggtgca 


atctcggctc 


actgcaacct 


28800 


ccacctccca 


ggctcaagca 


atcctcccat 


ctcagcctcc 


taagtaggtg 


ggactatagg 


28860 


catgcaccgc 


cacacctggc 


taatttttgt 


gttgttttgt 


agagatgatg 


tttcaccatg 


28920 


tttcccaggc 


tggtctcgaa 


ctcccaggct 


caaacaatcc 


acccacctta 


gtctcctaaa 


28980 


grtctgggat tactggcatg 


agccaccatg 


cctggcccta 


cctgttattt 


ctttatgatc 


29040 


tgttaaacta 


ggaagtgata 


tataaatatc etataatgga ttattttgtt 


cttcagcaag 


29100 


caacctgatt tgaaaataat 


aatcatatat 


gtacataaat 


ttatagtgtt 


ctattttctc 


29160 


tttaggaaaa taaggaaaaa 


caagaaagaa 


ttgaacgaaa 


acagaagaaa 


cgtcattcct 


29220 


ttcttgaaag 


tgaggcactt 


cctccgtgga 


gccctccaag 


cagaactgtg 


ttcgcaaaag 


29280 


tgttttgata 


attctagttc 


ttacattatt 


tggttattta 


tcggtttgcc 


aatattagcc 


29340 
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atagatttaa aaccattcaa ttatttatag ttagaggaat atattttaat taaatgccag 29400 

acactcctgc tgacaatgaa agaaatactt tggaatgtaa tcagtgaaag catttttttg 29460 

aactgtagat aaactgcctc aaacaaagac ctaataatca gattgttttt accattaaga 29520 

tacataagat tttatcatgt cctgataatt cttatggtgg agtgattcat gatctttttc 29580 

attaagctct gtatgttatt taagtatatt taattccagt aataaaaagg aaatcatcta 29640 

ggtaccataa tgatagaaat tattcctttt gtggatgatt gtgaatctag attcaggttt 29700 

ttaaatgaag ggtcgctggg aagtgcgcat atattattcc ttctgaaact 29750 

<210> 17 

<211> 200 

<212> DNA 

<213> Homo sapiens 

<400> 17 

acttccttcg tctgggtggt tgccccagcg acacgttggg ccgaagagcg gtgttgggta 60 

cccgagagac ccggcggtgg ggaagtcact tcctcccgaa gacgctgttt cctagcaacc 120 

gccctccgcc tctgttatta gcccctcctc ctcgctcggt ccaggaccgg ctctgcgggc 180" 
gccgccaggc ccagaccaag 200 



<211> 139 
<212> DNA 
<213> Homo sapiens 

<400> 18 

ctactatcag aagttgaatt ctaataatta gctattttat aaaggtaacg agaaaaaata 60 

cactatgtct gatgaagttt ttagcaccac tttggcatat acaaagagtc caaaagttac 120 

caaaagaact actttccag 139 

<210> 19 

<211> 85 

<212> DNA 

<213> Homo sapiens 



<210> 



18 



<400> 19 

gatgagctaa taagagcaat tacagctcgc tcagccagac 



aaaggagttc 



tgaatactca 



60 



gatgactttg acagtgatga gattg 
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<210> 20 

<211> 321 

<212> DNA 

<213> Homo sapiens 

<400> 20 

tttctttagg tgatttttct gacacttcag cagatgaaaa ttcagttaat aaaaaaatga 60 

atgactttca tatatcagat gatgaagaaa agaatccttc aaaactattg tttttgaaaa 120 

ccaataaatc aaacggtaac ataaccaaag atgagccagt gtgtgccatc aaaaatgaag 180 

aggaaatggc acctgatggg tgtgaagaca ttgttgtaaa atctttctct gaatctcaaa 240 

ataaggatga ggaatttgaa aaagacaaaa taaaaatgaa acctaaaccc agaattcttt 300 

caattaaaag cacatcttca g 321 

<210> 21 

<211> 227 

<212> DNA 

<213> Homo sapiens 

<400> 21 

cagaaaacaa cagccttgac acagatgatc actttaaacc atcacctcgg ccaaggagta 60 

tigttgaaaaa gaaaagtcac atggaggaga aggatggact agaagataaa gaaactgccc 120 

tcagtgaaga attggagtta cattctgcac cttcttccct tccaacgccg aatggcatac 180 

aattagaagc tgagaaaaaa gcattctctg aaaaccttga tcctgag 227 



<210> 



22 



<211> 



94 



<212> 



DNA 



<213> 



Homo sapiens 



<400> 22 

gartcatgct taacaagtct agcatcatca tcacttaaac aaattcttgg agattctttt 



60 



ncaccaggat ctgagggaaa egcatctgga aaag 



94 



<210> 23 



<211> 248 



<212> DNA 
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<213> Homo sapiens 



<400> 23 

atccaaatga agaaatcact gaaaaccata attccttgaa atcagatgaa aataaagaga 60 

attcattttc agcagaccat gtgactactg cagttgagaa atccaaggaa agtcaagtga 120 

ctgctgatga ccttgaagaa gaaaaggcaa aagcggaact gattatggat gatgacagaa 180 

cagttgatcc actactatct aaatctcaga gtatcttaat atctaccagt gcaacagcat 240 

cttcaaag 248 

<210> 24 

<211> 71 

<212> DNA 

<213> Homo sapiens 



<400> 24 

aaaacaattg aagatagaaa tataaagaat aaaaagtcaa caaataatag agcatccagt 60 
gcatctgcca g 71 

<210> 25 

<211> 169 

<212> DNA 

<213> Homo sapiens 



<400> 25 

attaatgacc tctgagtttt tgaagaaatc tagttctaaa aggagaactc catcgacaac 60 

tacctcttct cactatttag ggactttaaa agtcttggac caaaaacctt cacagaaaca 120 

gagcatagaa cctgatagag cagataacat aagggcagct gtttatcag 169 

<210> 26 

<2U> 90 

<212> DNA 

<213> Homo sapiens 

<400> 26 

9 a 9tggttag aaaagaaaaa tgtgtattta catgaaatgc acagaataaa aagaattgaa 60 
agtgaaaact taaggatcca aaatgaacag 90 

<210> 27 
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<211> 160 
<212> DNA 
<213> Homo sapiens 



<400> 27 

aaaaaagctg ctaaaagaga agaagcatta gcatcatttg aggcctggaa ggctatgaaa 60 

gaaaaggaag caaagaaaat agctgccaaa aagaggcttg aagaaaaaaa caagaagaaa 120 

actgaagaag aaaatgctgc aagaaaagga gaagcactac 160 

<210> 28 

<2U> 146 

<212> DNA 

<213> Homo sapiens 



<400> 28 

gcttttgaaa aatggaaaga gaaaaagatg gaatatctta aagagaaaaa tagaaaggag 60 

agagaatatg aaagagcaaa gaaacagaaa gaggaggaaa ctgttgccga gaaaaagaaa 120 

gataatttaa ctgctgttga gaaatg 146 

<210> 29 

<211> 133 

<212> DNA 

<213> Homo sapiens 



<400> 29 

gaatgaaaaa aaggaagctt ttttcaagca aaaggaaaaa gaaaaaataa atgagaaaag 60 

aaaggaagaa ctgaaaagag ctgagaaaaa agataaagat aaacaagcta ttaatgaata 120 
tgaaaaatgg ctg 133 

<210> 30 

<211> 485 

<212> DNA 

<213> Homo sapiens 

<400> 30 

gaaaataagg aaaaacaaga aagaattgaa cgaaaacaga agaaacgtca ttcctttctt 60 

gaaagtgagg cacttcctcc gtggagccct ccaagcagaa ctgtgttcgc aaaagtgttt 120 

tgataattct agttcttaca ttatttggtt atttatcggt ttgccaatat tagccataga 180 
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tttaaaacca ttcaattatt tatagttaga ggaatatatt ttaattaaat gccagacact 240 

cctgctgaca atgaaagaaa tactttggaa tgtaatcagt gaaagcattt ttttgaactg 300 

tagataaact gcctcaaaca aagacctaat aatc^gattg tttttaccat taagatacat 360 

aagattttat catgtcctga taattcttat ggtggagtga ttcatgatct ttttcattaa 420 

gctctgtatg ttatttaagt atatttaatt ccagtaataa aaaggaaatc atctaggtac 480 

cataa 485 

<210> 31 

<211> 24 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> Amorce 

<400> 31 

atgtctgatg aagtttttag cacc 24 

<210> 32 

<2U> 22 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> Amorce 

<400> 32 

aggcctcaaa tgatgctaat gc 22 

<210> 33 

<2U> 21 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Amorce 
<400> 33 

atcatttgag gcctggaagg c 21 
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<210> 34 

<211> 23 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> Amorce 

<400> 34 

aaacactttt gcgaacacag ttc ^ 

<210> 35 

<211> 21 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> Amorce 

<400> 35 

acaacgaata acagagtgtc c 21 

<210> 36 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Amorce 

<400> 36 _ n 
actcctgata aacagctgcc 20 

<210> 37 

<211> 29 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Amorce 
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<400> 37 

gccaccatgt ctgatgaagt ttttagcac 29 

<210> 38 

<211> 24 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Amorce 

<400> 38 

gaaacacttt tgcgaacaca gttc 24 

<210> 39 

<211> 26 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Amorce 

<400> 39 

taatgtctga tgaagttttt agcacc 26 

<210> 40 

<2U> 26 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Amorce 

<400> 40 

tcaaaacact tttgcgaaca cagttc 26 

<210> 41 

<211> 25 

<212> DNA 

<213> Artificial sequence 
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<220> 

<223> Amorce 

<400> 41 

aatgtctgat gaagttttta gcacc 

<210> 42 

<211> 19 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> Amorce 

<400> 42 

tcagcttgcc gtaggtggc 

<210> 43 

<211> 19 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> Amorce 

<400> 43 

atggtcctgc tggagttcg 

<210> 44 

<211> 391 

<212> DNA 

<213> Murinae gen. sp. 



S644PCT88.5T25 



25 



19 



19 



<400> 44 

aaagaagtga agacagaaac acgaagaata aaaagacaac gaataacaga gtgtccagtg 
cctctggcag gctgatgacc tctgagtttt taaagagatc cggtcccaca aaaagaagtc 
catctgcagc tacctcctca cactatttag ggagtttgaa agtcttggac cagaagcaac 
cacggaagca gagcctagag ccagacaagg ctgatcacat aagggcagct gtttatcagg 
agtggttaga aaagaaaaat gtgtatttac atgaaatgca cagaataaaa agaattgaaa 
gcgaaaactt gaggatccaa aatgaacaga aaaaagctgc taagagagag gaagccctgg 
catcatttga ggcctggaag gcaatgaaag a 

32 
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<210> 45 

<211> 2767 

<212> DNA 

<213> Mus musculus 

<220> 

<221> CDS 

<222> (204) . . (2147) 
<223> 



<400> 45 

gttgggtacc caagagacca ggcggttgga agtcacttcc tcccggggac gctgttgcct 60 

agcaaccgcc ttctgcctcc atcttttgcc ccgcctccag gttattccaa tacctggttt 120 

cccagaccgc gaggcccggg ccgggggcga cacctgtgct agagcatagc cgctgggttc 180 

tcagcagaga aaaaggacac acc atg tec gat gaa ate ttc age aca act ttg 233 

Met Ser Asp Glu lie Phe Ser Thr Thr Leu 
1 5 10 

gcg tac acc aag agt cca aag get acc aag aga act tec ttt cag gat 281 
Ala Tyr Thr Lys Ser Pro Lys Ala Thr Lys Arg Thr Ser Phe Gin Asp 
15 20 25 

gag ctg ate aga gee att aca gec egg tea gee agg cag aga agt tec 329 
Glu Leu lie Arg Ala lie Thr Ala Arg Ser Ala Arg Gin Arg Ser Ser 
30 35 40 

gaa tac tec gat gac ttt gac agt gac gag att gtt tct tta ggt gaa 377 
Glu Tyr Ser Asp Asp Phe Asp Ser Asp Glu lie Val Ser Leu Gly Glu 
45 50 55 

ttt tea gat acc teg aca gat gaa agt eta gtt aga aaa aag atg aat 425 
Phe ser Asp Thr ser Thr Asp Glu ser Leu val Arg Lys Lys Met Asn 
60 65 70 

gat ttt cat ata tec gac gat gag gaa aaa aat tct cca aga ctg tct 473 
Asp Phe His lie Ser Asp Asp Glu Glu Lys Asn ser Pro Arg Leu Ser 
75 80 85 90 

ttt ttg aaa acc aag aaa gta aac agg gca ata tec aac gat get ctg 521 
Phe Leu Lys Thr Lys Lys val Asn Arg Ala lie Ser Asn Asp Ala Leu 
95 100 105 

gac tec age act ccg ggc age gaa ggc teg tea ccg gat get caa gaa 569 
Asp Ser ser Thr Pro Gly Ser Glu Gly Ser ser Pro Asp Ala Gin Glu 
110 115 120 

gat gtg act gga gat tec etc ccc aaa tct caa aat gat gat cga gaa 617 
Asp Val Thr Gly Asp Ser Leu Pro Lys Ser Gin Asn Asp Asp Arg Glu 

665 



125 



130 



135 



gtc ggc aga gag ate ate aca gtg aag cct aca ccc agg atg cac ccc 
val Gly Arg Glu lie lie Thr val Lys Pro Thr Pro Arg Met His Pro 



140 



145 



150 



33 



WO 2004/058815 * • PCT7FR2003/003895 



S644PCT88.ST25 

gtc aaa aga age acg tec teg ggg gaa acc age age ggt ctt gat gea 

val Lys Arg Ser Thr ser Ser Gly Glu Thr Ser Ser Gly Leu Asp Ala 

155 160 165 170 



age age cac act gag gag gga gtc aga cca gga gtt gat aaa gaa cat 
Ser ser His Thr Glu Glu Gly val Arg Pro Gly val Asp Lys Glu His 
190 195 200 



acg aat aac aga gtg tec agt gee tct ggc age agg etg atg acc tct 
Thr Asn Asn Arg Val Ser Ser Ala Ser Gly Ser Arg Leu Met Thr Ser 
365 370 375 



713 



gat ggc cac ttt aag cct tea cce cag cca agg age atg tta aaa aag 761 
Asp Gly His Phe Lys Pro Ser Pro Gin Pro Arg Ser Met Leu Lys Lys 
175 180 185 



809 



tec ata age gaa gee tct get cce aca cct tec ctt cca agg cag aat 857 
Ser lie Ser Glu Ala Ser Ala Pro Thr Pro Ser Leu Pro Arg Gin Asn 
205 210 215 

ggc aca gag ttg caa act gag gaa aaa ata tac teg gaa aac etc gat 905 
Gly Thr Glu Leu Gin Thr Glu Glu Lys lie Tyr ser Glu Asn Leu Asp 
220 225 230 

ctt gag gac tea etc tta caa agt ctg acc tea tct tec ttc aaa gaa 953 
Leu Glu Asp Ser Leu Leu Gin Ser Leu Thr Ser Ser Ser Phe Lys Glu 
235 240 245 250 

age cce gga ggt tgc aca tea cca gga tct cag gaa aag gtg cce ata 1001 
Ser Pro Gly Gly Cys Thr Ser Pro Gly Ser Gin Glu Lys val Pro lie 
255 260 265 

aaa gat cat gat gga gaa cct act gaa ate tgg gat tec ttg eta tea 1049 
Lys Asp His Asp Giy Glu Pro Thr Glu lie Trp Asp Ser Leu Leu Ser 
270 275 280 

aat gaa aat gaa gga agt tct gtt ttg gtg aac tgt gtt act cct gaa 1097 
Asn Glu Asn Glu Gly Ser Ser val Leu val Asn cys val Thr Pro Glu 
285 290 295 

etc gag cag cec aag gac ggt cag gtg gca get gac gac ctt gag gaa 1145 
Leu Glu Gin Pro Lys Asp Gly Gin Vat Ala Ala Asp Asp Leu Glu Glu 
300 305 310 

gaa aga gag aag ggt gga ttt aca gaa gat gac etc acc act gac ccg 1193 
Glu Arg Glu Lys Gly Gly Phe Thr Glu Asp Asp Leu Thr Thr Asp Pro 
315 ~ 320 325 330 

ctg etc tec acg tec ccg agt gtc ata aca cec act gag cca gca gag 1241 
Leu Leu Ser Thr Ser Pro Ser Val lie Thr Pro Thr Glu Pro Ala Glu 
335 340 345 

ccg gee aag aaa gca aat gaa gac aga aac acg aag aat aaa aag aca 1289 
Pro Ala Lys Lys Ala Asn Glu Asp Arg Asn Thr Lys Asn Lys Lys Thr 
350 355 360 



1337 



gag ttt tta aag aga tec ggt cce aca aaa aga agt cca tct gca get 1385 
Glu Phe Leu Lys Arg Ser Gly Pro Thr Lys Arg Ser Pro Ser Ala Ala 
380 385 390 

acc tec tea cac tat tta ggg agt ttg aaa gtc ttg gac cag aag caa 1433 
Thr ser Ser His Tyr Leu Gly ser Leu Lys val Leu Asp Gin Lys Gin 
395 400 405 410 

cca egg aag cag age eta gag cca gac aag get gat cac ata agg gca 1481 
Pro Arg Lys Gin ser Leu Glu Pro Asp Lys Ala Asp His lie Arg Ala 
415 420 425 
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get gtt tat cag gag tgg tta gaa aag aaa aat gtg tat tta cat gaa 1529 

Ala val Tyr Gin Glu Trp Leu Glu Lys Lys Asn val Tyr Leu His Glu 

430 435 440 

atg cac aga ata aaa aga att gaa age gaa aac ttg agg ate caa aat 1577 

Met His Arg lie Lys Arg lie Glu Ser Glu Asn Leu Arg lie Gin Asn 
445 450 455 

gaa cag aaa aaa get get aag aga gag gaa gee ctg gca tea ttt gag 1625 

Glu Gin Lys Lys Ala Ala Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu 
460 465 ~ 470 

gee tgg aag gca atg aaa gag aag gaa gca aag aga ata get gca aaa 1673 

Ala Trp Lys Ala Met Lys Glu Lys Glu Ala Lys Arg lie Ala Ala Lys 

475 480 485 490 

aag agg ctg gag gaa aag aac aag aag aaa aca gaa gaa gaa aat gee 1721 

Lys Arg Leu Glu Glu Lys Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala 
495 500 505 

atg agg aaa ggc gag gee ctg caa gca ttt gaa aaa tgg aaa gag aaa 1769 

Met Arg Lys Gly Glu Ala Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys 

510 515 520 

aag eta gaa tac etc aaa gag aag acc agg agg gag aaa gaa tat gaa 1817 

Lys Leu Glu Tyr Leu Lys Glu Lys Thr Arg Arg Glu Lys Glu Tyr Glu 
525 530 535 

aga gca aag aaa cag aaa gaa gag gaa gcg gtt get gag aaa aag aaa 1865 

Arg Ala Lys Lys Gin Lys Glu Glu Glu Ala val Ala Glu Lys Lys Lys 
540 545 550 

gac agt tta act get ttt gaa aaa tgg agt gag aga aag gaa get etc 1913 

Asp ser Leu Thr Ala Phe Glu Lys Trp Ser Glu Arg Lys Glu Ala Leu 

555 560 565 570 

etc aag caa aag gag aag gag aaa ata aat gag aga aga aag gaa gag 1961 

Leu Lys Gin Lys Glu Lys Glu Lys lie Asn Glu Arg Arg Lys Glu Glu 
575 580 " 585 

ctg aag aga gee gag aag aaa gac aaa gac aag caa gee ate agt gaa 2009 

Leu Lys Arg Ala Glu Lys Lys Asp Lys Asp Lys Gin Ala lie ser Glu 

590 595 600 

tac gaa aag tgg ctg gaa aag aaa gaa agg caa gaa aga att gaa egg 2057 

Tyr Glu Lys Trp Leu Glu Lys Lys Glu Arg Gin Glu Arg lie Glu Arg 
605 610 615 

aaa cag aag aag cgc cac tec ttc ctt gag age gag aca cac cca cca 2105 

Lys Gin Lys Lys Arg His Ser Phe Leu Glu ser Glu Thr His Pro Pro 
620 625 630 



tgg agt cct ccg age aga act gcg ccc tea aaa 
Trp ser Pro Pro Ser Arg Thr Ala Pro Ser Lys 
635 640 645 


gta ttt tga 
val Phe 


2147 


tgtttctggt 


tcttgatttt tttttcagtt 


caccaactgt 


actcatggat 


ttaaaacgag 


2207 


tcatctcatt 


atttgtggtt agaagactct 


atgtcacttc 


ectgeaggag 


cttctgtgga 


2267 


gcatgaaaga 


gatactttgc agtttaatca 


gtggaaacat 


tttctgaagt 


gtcctcatca 


2327 


gtttgctggg 


acaatccaga egcatgaage 


tttattatga 


cctgaacagt 


ctggtgtggg 


2387 


gtgattcgtg 


gtcactgtcg ctgagttcgg 


agtcttttta 


aagaatgttt 


gatcccacta 


2447 


atgaaagaat 


gecagctaga taccacaatc 


gtagagatga 


cteggtctgt 


ggaagtctgt 


2507 
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gcttctagag tgtagtttgg gcattgaagg tccctggaga ccatgggcat gttatctctt 2567 

ctaactccag ttcttcaggt cacagaagta tctttgctgt gcaagttatc gactcagtca 2627 

gttgaggcca cagaactcta gtcagtcact ttagtaaaga actttgccat agggtttaat 2687 

ctcggtgtgg tttgccttct tgaggcttac ctgacaatcg tagccacctc tataatgggc 2747 

tcacttctgg aatgttcttt 2767 

<210> 46 

<211> 647 

<212> PRT 

<213> Mus musculus 

<400> 46 

Met Ser Asp Glu lie Phe Ser Thr Thr Leu Ala Tyr Thr Lys ser Pro 
15 10 15 

Lys Ala Thr Lys Arg Thr Ser Phe Gin Asp Glu Leu lie Arg Ala lie 
20 25 30 

Thr Ala Arg Ser Ala Arg Gin Arg Ser Ser Glu Tyr Ser Asp Asp Phe 
35 40 45 

Asp Ser Asp Glu lie Val Ser Leu Gly Glu Phe Ser Asp Thr Ser Thr 
50 55 60 

Asp Glu Ser Leu val Arg Lys Lys Met Asn Asp Phe His He ser Asp 
65 70 75 80 

Asp Glu Glu Lys Asn ser Pro Arg Leu Ser Phe Leu Lys Thr Lys Lys 
85 90 95 

Val Asn Arg Ala lie Ser Asn Asp Ala Leu Asp Ser ser Thr Pro Gly 
100 105 110 

ser Glu Gly Ser ser Pro Asp Ala Gin Glu Asp Val Thr Gly Asp Ser 
115 120 125 

Leu Pro Lys Ser Gin Asn Asp Asp Arg Glu Val Gly Arg Glu lie lie 
130 135 140 

Thr val Lys Pro Thr Pro Arg Met His Pro val Lys Arg ser Thr ser 
145 150 155 160 

Ser Gly Glu Thr Ser ser Gly Leu Asp Ala Asp Gly His Phe Lys Pro 
165 170 175 
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Ser Pro Gin Pro Arg Ser Met Leu l_ys Lys Ser Ser His Thr Glu Glu 
180 185 190 

Gly Val Arg Pro Gly val Asp Lys Glu His Ser lie Ser Glu Ala Ser 
195 200 205 

Ala Pro Thr Pro Ser Leu Pro Arg Gin Asn Gly Thr Glu Leu Gin Thr 
210 215 220 

Glu Glu Lys lie Tyr Ser Glu Asn Leu Asp Leu Glu Asp Ser Leu Leu 
225 230 235 240 

Gin Ser Leu Thr Ser Ser Ser Phe Lys Glu ser Pro Gly Gly Cys Thr 
245 250 255 

Ser Pro Gly ser Gin Glu Lys Val Pro lie Lys Asp His Asp Gly Glu 
260 265 270 

Pro Thr Glu lie Trp Asp Ser Leu Leu Ser Asn Glu Asn Glu Gly Ser 
275 280 285 

Ser val Leu val Asn cys val Thr Pro Glu Leu Glu Gin Pro Lys Asp 
290 295 300 

Gly Gin Val Ala Ala Asp Asp Leu Glu Glu Glu Arg Glu Lys Gly Gly 
305 310 315 320 

Phe Thr Glu Asp Asp Leu Thr Thr Asp Pro Leu Leu Ser Thr Ser Pro 
325 330 335 

Ser Val lie Thr Pro Thr Glu Pro Ala Glu Pro Ala Lys Lys Ala Asn 
340 345 350 

Glu Asp Arg Asn Thr Lys Asn Lys Lys Thr Thr Asn Asn Arg val ser 
355 360 365 

Ser Ala Ser Gly Ser Arg Leu Met Thr Ser Glu Phe Leu Lys Arg Ser 
370 375 380 

Gly Pro Thr Lys Arg Ser Pro Ser Ala Ala Thr Ser ser His Tyr Leu 
385 390 395 400 

Gly Ser Leu Lys Val Leu Asp Gin Lys Gin Pro Arg Lys Gin ser Leu 
405 410 415 

Glu Pro Asp Lys Ala Asp His lie Arg Ala Ala val Tyr Gin Glu Trp 
420 425 430 

Leu Glu Lys Lys Asn val Tyr Leu His Glu Met His Arg lie Lys Arg 
435 440 445 
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lie Glu Ser Glu Asn Leu Arg lie Gin Asn Glu Gin Lys Lys Ala Ala 
450 455 460 

Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu Ala Trp Lys Ala Met Lys 
465 470 475 480 

Glu Lys Glu Ala Lys Arg lie Ala Ala Lys Lys Arg Leu Glu Glu Lys 
485 490 495 

Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala Met Arg Lys Gly Glu Ala 
500 505 510 

Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys Lys Leu Glu Tyr Leu Lys 
515 520 525 

Glu Lys Thr Arg Arg Glu Lys Glu Tyr Glu Arg Ala Lys Lys Gin Lys 
530 535 540 

Glu Glu Glu Ala val Ala Glu Lys Lys Lys Asp Ser Leu Thr Ala Phe 
545 550 555 560 

Glu Lys Trp ser Glu Arg Lys Glu Ala Leu Leu Lys Gin Lys Glu Lys 
565 570 575 

Glu Lys lie Asn Glu Arg Arg Lys Glu Glu Leu Lys Arg Ala Glu Lys 
580 585 590 

Lys Asp Lys Asp Lys Gin Ala lie ser Glu Tyr Glu Lys Trp Leu Glu 
595 600 605 

Lys Lys Glu Arg Gin Glu Arg lie Glu Arg Lys Gin Lys Lys Arg His 
610 615 .620 

Ser Phe Leu Glu Ser Glu Thr His Pro Pro Trp Ser Pro Pro Ser Arg 
625 630 635 640 

Thr Ala Pro ser Lys Val Phe 
645 

<210> 47 
<211> 647 
<212> PRT 

<213> artificial sequence 



<400> 47 

Met Ser Asp Glu lie Phe ser Thr Thr Leu Ala Tyr Thr Lys ser Pro 
1 5 10 15 
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Lys Ala Thr Lys Arg Thr ser Phe Gin Asp Glu Leu lie Arg Ala lie 
20 25 30 

Thr Ala Arg Ser Ala Arg Gin Arg ser ser Glu Tyr Ser Asp Asp Phe 
35 40 45 3 

Asp Ser Asp Glu lie val ser Leu Gly Glu Phe Ser Asp Thr Ser Thr 
50 55 60 

Asp Glu Ser Leu val Arg Lys Lys Met Asn Asp Phe His lie Ser Asp 
65 70 75 80 

Asp Glu Glu Lys Asn Ser Pro Arg Leu Ser Phe Leu Lys Thr Lys Lys 
85 ~ 90 95 

Val Asn Arg Ala lie ser Asn Asp Ala Leu Asp Ser ser Thr Pro Gly 
100 105 110 

Ser Glu Gly Ser Ser Pro Asp Ala Gin Glu Asp val Thr Gly Asp Ser 
115 120 125 

Leu Pro Lys Ser Gin Asn Asp Asp Arg Glu val Gly Arg Glu lie lie 
130 135 140 

Thr Val Lys Pro Thr Pro Arg Met His Pro val Lys Arg ser Thr Ser 
145 150 155 160 

ser Gly Glu Thr Ser Ser Gly Leu Asp Ala Asp Gly His Phe Lys Pro 
165 170 175 

Ser Pro Gin Pro Arg Ser Met Leu Lys Lys Ser ser His Thr Glu Glu 
180 185 190 

Gly Val Arg Pro Gly val Asp Lys Glu His ser lie ser Glu Ala ser 
195 200 205 

Ala Pro Thr Pro ser Leu Pro Arg Gin Asn Gly Thr Glu Leu Gin Thr 
210 215 220 

Glu Glu Lys lie Tyr ser Glu Asn Leu Asp Leu Glu Asp Ser Leu Leu 
225 230 235 240 

Gin ser Leu Thr Ser Ser Ser Phe Lys Glu Ser Pro Gly Gly Cys Thr 
245 250 255 



Ser Pro Gly Ser Gin Glu Lys Val Pro lie Lys Asp His Asp Gly Glu 
260 265 270 

Pro Thr Glu lie Trp Asp Ser Leu Leu Ser Asn Glu Asn Glu Gly Ser 

275 280 285 
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Ser val Leu val Asn Cys val Thr Pro Glu Leu Glu Gin Pro Lys Asp 
290 295 300 

Gly Gin Val Ala Ala Asp Asp Leu Glu Glu Glu Arg Glu Lys Gly Gly 
305 310 315 320 

Phe Thr Glu Asp Asp Leu Thr Thr Asp Pro Leu Leu Ser Thr Ser Pro 

325 330 335 

Ser Val lie Thr Pro Thr Glu Pro Ala Glu Pro Ala Lys Lys Ala Asn 
340 345 350 

Glu Asp Arg Asn Thr Lys Asn Lys Lys Thr Thr Asn Asn Arg val Ser 
355 360 365 

Ser Ala Ser Gly ser Arg Leu Met Thr Ser Glu Phe Leu Lys Arg Ser 
370 375 380 

Gly Pro Thr Lys Arg ser Pro ser Ala Ala Thr Ser Ser His Tyr Leu 
385 390 395 400 

Gly Ser Leu Lys val Leu Asp Gin Lys Gin Pro Arg Lys Gin Ser Leu 
405 410 415 

Glu Pro Asp Lys Ala Asp His lie Arg Ala Ala Val Tyr Gin Glu Trp 
420 425 430 

Leu Glu Lys Lys Asn val Tyr Leu His Glu Met His Arg lie Lys Arg 
435 440 445 

lie Glu Ser Glu Asn Leu Arg He Gin Asn Glu Gin Lys Lys Ala Ala 
450 455 460 

Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu Ala Trp Lys Ala Met Lys 
465 470 475 480 

Glu Lys Glu Ala Lys Arg lie Ala Ala Lys Lys Arg Leu Glu Glu Lys 
485 " 490 495 

Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala Met Arg Lys Gly Glu Ala 
500 505 510 

Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys Lys Leu Glu Tyr Leu Lys 
515 520 525 

Glu Lys Thr Arg Arg Glu Lys Glu Tyr Glu Arg Ala Lys Lys Gin Lys 
530 535 540 

Glu Glu Glu Ala val Ala Glu Lys Lys Lys Asp Ser Leu Thr Ala Phe 
545 550 555 560 
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Glu Lys Trp Ser Glu Arg Lys Glu Ala Leu Leu Lys Gin Lys Glu Lys 
565 570 575 

Glu Lys lie Asn Glu Arg Arg Lys Glu Glu Leu Lys Arg Ala Glu Lys 
580 585 590 

Lys Asp Lys Asp Lys Gin Ala lie Ser Glu Tyr Glu Lys Trp Leu Glu 
595 600 605 

Lys Lys Glu Arg Gin Glu Arg lie Glu Arg Lys Gin Lys Lys Arg His 
610 615 620 

ser Phe Leu Glu Ser Glu Thr His Pro Pro Trp Ser Pro Pro Ser Arg 
625 630 635 640 

Thr Ala Pro Ser Lys val Phe 
645 

<210> 48 
<211> 344 
<212> PRT 

<213> artificial sequence 



<220> 

<223> hASAP peptide mutant 411-647 
<400> 48 

Glu Ser Gin Val Thr Ala Asp Asp Leu Glu Glu Glu Lys Ala Lys Ala 
1 5 10 15 

Glu Leu lie Met Asp Asp Asp Arg Thr Val Asp Pro Leu Leu Ser Lys 
20 25 30 

Ser Gin ser He Leu lie Ser Thr Ser Ala Thr Ala Ser Ser Lys Lys 
35 40 45 

Thr lie Glu Asp Arg Asn lie Lys Asn Lys Lys ser Thr Asn Asn Arg 
50 .55 60 

Ala Ser Ser Ala Ser Ala Arg Leu Met Thr Ser Glu Phe Leu Lys Lys 
65 70 75 80 

Ser ser Ser Lys Arg Arg Thr Pro Ser Thr Thr Thr Ser Ser His Tyr 
85 90 95 

Leu Gly Thr Leu Lys val Leu Asp Gin Lys Pro ser Gin Lys Gin ser 
100 105 110 
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lie Glu Pro Asp Arg Ala Asp Asn lie Arg Ala Ala Val Tyr Gin Glu 
115 120 125 

Trp Leu Glu Lys Lys Asn Val Tyr Leu His Glu Met His Arg lie Lys 
130 ' 135 140 

Arg lie Glu ser Glu Asn Leu Arg lie Gin Asn Glu Gin Lys Lys Ala 
145 150 155 160 

Ala Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu Ala Trp Lys Ala Met 
165 170 175 

Lys Glu Lys Glu Ala Lys Lys lie Ala Ala Lys Lys Arg Leu Glu Glu 
180 185 190 

Lys Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala Ala Arg Lys Gly Glu 
195 200 205 

Ala Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys Lys Met Glu Tyr Leu 
210 215 220 

Lys Glu Lys Asn Arg Lys Glu Arg Glu Tyr Glu Arg Ala Lys Lys Gin 
225 230 235 240 

Lys Glu Glu Glu Thr Val Ala Glu Lys Lys Lys Asp Asn Leu Thr Ala 
245 250 255 

Val Glu Lys Trp Asn Glu Lys Lys Glu Ala Phe Phe Lys Gin Lys Lys 
260 265 270 

Lys Glu Lys lie Asn Glu Lys Arg Lys Glu Glu Leu Lys Arg Ala Glu 
275 280 285 

Lys Lys Asp Lys Asp Lys Gin Ala lie Asn Glu Tyr Glu Lys Trp Leu 
290 295 300 

Glu Asn Lys Glu Lys Gin Glu Arg lie Glu Arg Lys Gin Lys Lys Arg 
305 310 315 320 

His Ser Phe Leu Glu ser Glu Ala Leu Pro Pro Trp Ser Pro Pro Ser 

325 330 335 

Arg Thr val Phe Ala Lys val Phe 
340 

<210> 49 
<211> 237 
<212> PRT 

<213> artificial sequence 
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<220> 

<223> hASAP mutant 411-647 
<400> 49 

Ser Gin Lys Gin Ser lie Glu Pro Asp Arg Ala Asp Asn lie Arg Ala 
15 10 15 

Ala val Tyr Gin Glu Trp Leu Glu Lys Lys Asn Val Tyr Leu His Glu 
20 25 30 

Met His Arg lie Lys Arg lie Glu Ser Glu Asn Leu Arg lie Gin Asn 
35 40 45 

Glu Gin Lys Lys Ala Ala Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu 
50 55 60 

Ala Trp Lys Ala Met Lys Glu Lys Glu Ala Lys Lys lie Ala Ala Lys 
65 70 75 80 

Lys Arg Leu Glu Glu Lys Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala 
85 90 95 

Ala Arg Lys Gly Glu Ala Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys 
. 100 105 110 

Lys Met Glu Tyr Leu Lys Glu Lys Asn Arg Lys Glu Arg Glu Tyr Glu 
115 120 125 

Arg Ala Lys Lys Gin Lys Glu Glu Glu Thr val Ala Glu Lys Lys Lys 
130 135 140 

Asp Asn Leu Thr Ala Val Glu Lys Trp Asn Glu Lys Lys Glu Ala Phe 
145 150 155 160 

Phe Lys Gin Lys Lys Lys Glu Lys lie Asn Glu Lys Arg Lys Glu Glu 
165 170 175 

Leu Lys Arg Ala Glu Lys Lys Asp Lys Asp Lys Gin Ala lie Asn Glu 
180 185 190 

Tyr Glu Lys Trp Leu Glu Asn Lys Glu Lys Gin Glu Arg lie Glu Arg 
195 200 ' 205 



Lys Gin Lys Lys Arg His Ser Phe Leu Glu Ser Glu Ala Leu Pro Pro 

210 215 220 

Trp ser Pro Pro ser Arg Thr val Phe Ala Lys val Phe 
225 230 235 
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<210> 50 
<211> 170 
<212> PRT 

<213> artificial sequence 
<220> 

<223> hASAP mutant 478-647 
<400> 50 

Ala Met Lys Glu Lys Glu Ala Lys Lys lie Ala Ala Lys Lys Arg Leu 
1 5 10 15 

Glu Glu Lys Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala Ala Arg Lys 
20 25 30 

Gly Glu Ala Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys Lys Met Glu 
35 40 45 

Tyr Leu Lys Glu Lys Asn Arg Lys Glu Arg Glu Tyr Glu Arg Ala Lys 
50 55 60 

Lys Gin Lys Glu Glu Glu Thr val Ala Glu Lys Lys Lys Asp Asn Leu 
65 70 75 80 

Thr Ala val Glu Lys Trp Asn Glu Lys Lys Glu Ala Phe Phe Lys Gin 
85 90 95 

Lys Lys Lys Glu Lys lie Asn Glu Lys Arg Lys Glu Glu Leu Lys Arg 
100 105 110 

Ala Glu Lys Lys Asp Lys Asp Lys Gin Ala lie Asn Glu Tyr Glu Lys 
115 120 125 

Trp Leu Glu Asn Lys Glu Lys Gin Glu Arg lie Glu Arg Lys Gin Lys 
130 135 140 

Lys Arg His Ser Phe Leu Glu Ser Glu Ala Leu Pro Pro Trp ser Pro 
145 150 155 160 

Pro Ser Arg Thr Val Phe Ala Lys Val Phe 
165 170 

<210> 51 
<211> 477 
<212> PRT 

<213> artificial sequence 
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<220> 

<223> hASAP mutant 1-477 
<400> 51 

Met ser Asp Glu Val Phe Ser Thr Thr Leu Ala Tyr Thr Lys Ser Pro 
1 5 10 15 

Lys val Thr Lys Arg Thr Thr Phe Gin Asp Glu Leu lie Arg Ala lie 
20 25 30 

Thr Ala Arg Ser Ala Arg Gin Arg Ser Ser Glu Tyr Ser Asp Asp Phe 
35 40 45 

Asp Ser Asp Glu lie Val Ser Leu Gly Asp Phe Ser Asp Thr ser Ala 
50 55 60 

Asp Glu Asn Ser Val Asn Lys Lys Met Asn Asp Phe His lie Ser Asp 
65 70 75 80 

Asp Glu Glu Lys Asn Pro Ser Lys Leu Leu Phe Leu Lys Thr Asn Lys 
85 90 95 

Ser Asn Gly Asn lie Thr Lys Asp Glu Pro val Cys Ala lie Lys Asn 
100 105 110 

Glu Glu Glu Met Ala Pro Asp Gly Cys Glu Asp lie val val Lys Ser 
115 120 125 

Phe Ser Glu Ser Gin Asn Lys Asp Glu Glu Phe Glu Lys Asp Lys He 
130 135 140 

Lys Met Lys Pro Lys Pro Arg lie Leu ser lie Lys Ser Thr Ser Ser 
145 150 155 160 

Ala Glu Asn Asn ser Leu Asp Thr Asp Asp His Phe Lys Pro Ser Pro 
165 170 175 

Trp Pro Arg Ser Met Leu Lys Lys Lys Ser His Met Glu Glu Lys Asp 
180 185 190 

Gly Leu Glu Asp Lys Glu Thr Ala Leu Ser Glu Glu Leu Glu Leu His 
195 200 205 

Ser Ala Pro Ser Ser Leu Pro Thr Pro Asn Gly lie Gin Leu Glu Ala 
210 215 220 

Glu Lys Lys Ala Phe ser Glu Asn Leu Asp Pro Glu Asp Ser Cys Leu 
225 230 235 240 
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Thr ser Leu Ala Ser Ser Ser Leu Lys Gin lie Leu Gly Asp Ser Phe 
245 250 255 

Ser Pro Gly Ser Glu Gly Asn Ala Ser Gly Lys Asp Pro Asn Glu Glu 
260 265 270 

lie Thr Glu Asn His Asn ser Leu Lys Ser Asp Glu Asn Lys Glu Asn 
275 280 285 

Ser Phe Ser Ala Asp His val Thr Thr Ala Val Glu Lys Ser Lys Glu 
290 295 300 

Ser Gin val Thr Ala Asp Asp Leu Glu Glu Glu Lys Ala Lys Ala Glu 
305 310 315 320 

Leu lie Met Asp Asp Asp Arg Thr Val Asp Pro Leu Leu ser Lys ser 
325 ~ 330 335 

Gin Ser lie Leu lie ser Thr ser Ala Thr Ala Ser Ser Lys Lys Thr 
340 345 350 

lie Glu Asp Arg Asn lie Lys Asn Lys Lys Ser Thr Asn Asn Arg Ala 
355 " 360 365 

Ser Ser Ala Ser Ala Arg Leu Met Thr Ser Glu Phe Leu Lys Lys Ser 
370 375 380 

Ser Ser Lys Arg Arg Thr Pro Ser Thr Thr Thr Ser Ser His Tyr Leu 
385 390 395 400 

Gly Thr Leu Lys val Leu Asp Gin Lys Pro Ser Gin Lys Gin Ser lie 
405 410 415 

Glu Pro Asp Arg Ala Asp Asn lie Arg Ala Ala Val Tyr Gin Glu Trp 
420 425 430 

Leu Glu Lys Lys Asn Val Tyr Leu His Glu Met His Arg lie Lys Arg 
435 440 445 

lie Glu Ser Glu Asn Leu Arg lie Gin Asn Glu Gin Lys Lys Ala Ala 
450 455 460 

Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu Ala Trp Lys 
465 470 475 

<210> 52 
<211> 418 
<212> PRT 

<213> artificial sequence 
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<220> 

<223> hASAP mutant 1-418 
<400> 52 

Met ser Asp Glu Val Phe Ser Thr Thr Leu Ala Tyr Thr Lys Ser Pro 
1 5 10 15 

Lys val Thr Lys Arg Thr Thr Phe Gin Asp Glu Leu lie Arg Ala lie 
20 25 30 

Thr Ala Arg Ser Ala Arg Gin Arg ser Ser Glu Tyr Ser Asp Asp Phe 
35 40 45 

Asp Ser Asp Glu lie val Ser Leu Gly Asp Phe ser Asp Thr ser Ala 
50 55 60 

Asp Glu Asn ser val Asn Lys Lys Met Asn Asp Phe His lie Ser Asip 
65 70 75 80 

Asp Glu Glu Lys Asn Pro Ser Lys Leu Leu phe Leu Lys Thr Asn Lys 
85 90 95 

Ser Asn Gly Asn lie Thr Lys Asp Glu Pro val Cys Ala He Lys Asn 
100 105 110 

Glu Glu Glu Met Ala Pro Asp Gly Cys Glu Asp lie val val Lys Ser 
115 120 125 

Phe Ser Glu Ser Gin Asn Lys Asp Glu Glu Phe Glu Lys Asp Lys lie 
130 135 140 

Lys Met Lys Pro Lys Pro Arg lie Leu Ser lie Lys Ser Thr ser ser 
145 150 155 160 

Ala Glu Asn Asn Ser Leu Asp Thr Asp Asp His Phe Lys Pro ser Pro 
165 170 175 

Trp pro Arg Ser Met Leu Lys Lys Lys Ser His Met Glu Glu Lys Asp 
180 185 190 

Gly Leu Glu Asp Lys Glu Thr Ala Leu ser Glu Glu Leu Glu Leu His 
195 200 205 

Ser Ala Pro Ser Ser Leu Pro Thr Pro Asn Gly lie Gin Leu Glu Ala 
210 215 220 

Glu Lys Lys Ala Phe Ser Glu Asn Leu Asp Pro Glu Asp Ser cys Leu 
225 230 235 240 
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Thr ser Leu Ala Ser Ser Ser Leu Lys Gin lie Leu Gly Asp ser Phe 

245 250 255 

ser Pro Gly Ser Glu Gly Asn Ala Ser Gly Lys Asp Pro Asn Glu Glu 
260 265 270 

lie Thr Glu Asn His Asn Ser Leu Lys Ser Asp Glu Asn Lys Glu Asn 
275 280 285 

Ser Phe ser Ala Asp His val Thr Thr Ala val Glu Lys ser Lys Glu 
290 295 300 

Ser Gin Val Thr Ala Asp Asp Leu Glu Glu Glu Lys Ala Lys Ala Glu 
305 310 315 320 

Leu lie Met Asp Asp Asp Arg Thr val Asp Pro Leu Leu Ser Lys ser 
325 330 335 

Gin ser lie Leu lie ser Thr Ser Ala Thr Ala Ser Ser Lys Lys Thr 
340 345 350 

lie Glu Asp Arg Asn lie Lys Asn Lys Lys Ser Thr Asn Asn Arg Ala 
355 360 365 

Ser Ser Ala Ser Ala Arg Leu Met Thr Ser Glu Phe Leu Lys Lys ser 
370 375 380 

Ser ser Lys Arg Arg Thr Pro Ser Thr Thr Thr Ser Ser His Tyr Leu 
385 390 395 400 

Gly Thr Leu Lys val Leu Asp Gin Lys Pro ser Gin Lys Gin Ser lie 
405 410 415 

Glu Pro 



<210> 53 
<211> 303 
<212> PRT 

<213> artificial sequence 

<220> 

<223> hASAP mutant 1-303 
<400> 53 

Met Ser Asp Glu val Phe Ser Thr Thr Leu Ala Tyr Thr Lys Ser Pro 
15 10 15 



48 



WO 20^4/058815 PCT/FR2003/003895 

S644PCT88.ST25 

Lys val Thr Lys Arg Thr Thr Phe Gin Asp Glu Leu He Arg Ala lie 
20 25 30 

Thr Ala Arg Ser Ala Arg Gin Arg Ser Ser Glu Tyr Ser Asp Asp Phe 
35 40 45 

Asp ser Asp Glu lie val Ser Leu Gly Asp Phe Ser Asp Thr Ser Ala 
50 55 60 

Asp Glu Asn ser Val Asn Lys Lys Met Asn Asp Phe His lie Ser Asp 
65 70 75 80 

Asp Glu Glu Lys Asn Pro Ser Lys Leu Leu Phe Leu Lys Thr Asn Lys 
85 90 95 

Ser Asn Gly Asn lie Thr Lys Asp Glu Pro Val cys Ala lie Lys Asn 
100 105 110 

Glu Glu Glu Met Ala Pro Asp Gly Cys Glu Asp lie Val val Lys Ser 
115 120 125 

Phe Ser Glu Ser Gin Asn Lys Asp Glu Glu Phe Glu Lys Asp Lys lie 
130 135 140 

Lys Met Lys Pro Lys Pro Arg lie Leu Ser lie Lys Ser Thr ser ser 
145 150 155 160 

Ala Glu Asn Asn Ser Leu Asp Thr Asp Asp His Phe Lys Pro Ser Pro 
165 170 175 

Trp pro Arg Ser Met Leu Lys Lys Lys Ser His Met Glu Glu Lys Asp 
180 185 190 

Gly Leu Glu Asp Lys Glu Thr Ala Leu Ser Glu Glu Leu Glu Leu His 
195 200 205 

Ser Ala Pro Ser Ser Leu Pro Thr Pro Asn Gly lie Gin Leu Glu Ala 
210 215 220 

Glu Lys Lys Ala Phe Ser Glu Asn Leu Asp Pro Glu Asp Ser Cys Leu 
225 230 235 240 

Thr Ser Leu Ala Ser Ser Ser Leu Lys Gin lie Leu Gly Asp Ser Phe 
245 250 255 

Ser Pro Gly Ser Glu Gly Asn Ala Ser Gly Lys Asp Pro Asn Glu Glu 
260 265 270 

lie Thr Glu Asn His Asn ser Leu Lys Ser Asp Glu Asn Lys Glu Asn 
275 280 285 
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ser Phe Ser Ala Asp His val Thr Thr Ala val Glu Lys Ser Lys 
290 295 300 
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